Lexnlp por lexpredict
Recuperação de informações e extração para texto legal real e não estruturado
O Lexnlp é uma biblioteca para trabalhar com texto legal real e não estruturado, incluindo contratos, planos, políticas, procedimentos e outros materiais.
Lexnlp fornece funcionalidade como:
- Segmentação e tokenização, como
- Um analisador de frases que está ciente de abreviações legais comuns como a LLC. ou f.3d.
- Modelos de segmentação pré-treinados para conceitos legais, como páginas ou seções.
- Modelos de incorporação e tópicos pré-treinados, amplamente e para áreas de prática específicas
- Classificadores pré-treinados para tipo de documento e tipo de cláusula
- Ampla gama de extração de fatos, como:
- Quantidades monetárias, quantidades não monetárias, porcentagens, proporções
- Declarações e restrições condicionais, como "menos de" ou "depois"
- Datas, datas recorrentes e durações
- Tribunais, regulamentos e citações
- Ferramentas para criar novos métodos de clustering e classificação
- Centenas de testes de unidade de documentos legais reais
Informação
- Contraxsuite: https://contraxsuite.com/
- Lexpredict: https://lexpredict.com/
- Site oficial: https://lexnlp.com/
- Documentação: http://lexpredict-lexnlp.readthedocs.io/en/latest/ (em andamento)
- Contato: [email protected]
Estrutura
- Aplicativo da web contraxsuite: https://github.com/lexpredict/lexpredict-contraxsuite
- Biblioteca Lexnlp para Extração: https://github.com/lexpredict/lexpredict-lexnlp
- Modelos pré-treinados contraxsuite e "conjuntos de conhecimento": https://github.com/lexpredict/lexpredict-legal-dictionary
- Amostras de contrato contraxsuite: https://github.com/lexpredict/lexpredict-contraxsuite-samples
- Automação de implantação de contraxsuite: https://github.com/lexpredict/lexpredict-contraxsuite-deploy Observe que as instalações contraxsuite geralmente requerem modelos treinados ou conjuntos de conhecimento para uso.
Licenciamento
O Lexnlp está disponível sob um modelo de licenciamento duplo. Por padrão, esta biblioteca pode ser usada nos termos AGPLV3, conforme detalhado no arquivo de licença do repositório; No entanto, as organizações podem solicitar um comunicado dos termos da AGPL ou de uma licença de avaliação não-GPL entrando em contato com o licenciamento do contraxsuite em <[email protected]>.
Requisitos
Lançamentos
- 2.3.0: 30 de novembro de 2022 - vinte e sexto lançamento público programado; código
- 2.2.1.0: 10 de agosto de 2022 - Vigésimo quinto lançamento público programado; código
- 2.2.0: 7 de julho de 2022 - Vigésimo quarto lançamento público programado; código
- 2.1.0: 16 de setembro de 2021 - Vinte terceiro lançamento público programado; código
- 2.0.0: 10 de maio de 2021 - Vinte segundos de lançamento público programado; código
- 1.8.0: 2 de dezembro de 2020 - vinte primeiro lançamento público programado; código
- 1.7.0: 27 de agosto de 2020 - Vigésimo lançamento público programado; código
- 1.6.0: 27 de maio de 2020 - Décimo século XVII, liberação pública programada; código
- 1.4.0: 20 de dezembro de 2019 - Décimo oitavo lançamento público programado; código
- 1.3.0: 1 de novembro de 2019 - Décimo Sétimo Release Público programado; código
- 0.2.7: 1º de agosto de 2019 - Décimo Segunda Release Pública programada; código
- 0.2.6: 12 de junho de 2019 - Décimo Quinto Release Pública programada; código
- 0.2.5: 1º de março de 2019 - Décimo Quarço Release Pública programada; código
- 0.2.4: 1 de fevereiro de 2019 - Décima Terceira Release Pública programada; código
- 0.2.3: 10 de junho de 2019 - Décima Segunda Liberação Pública Programada; código
- 0.2.2: 30 de setembro de 2018 - Lançamento público programado para o décimo primeiro; código
- 0.2.1: 24 de agosto de 2018 - Décimo lançamento público programado; código
- 0.2.0: 1 de agosto de 2018 - nono lançamento público programado; código
- 0.1.9: 1 de julho de 2018 - nono lançamento público programado; código
- 0.1.8: 1 de maio de 2018 - oitavo lançamento público programado; código
- 0.1.7: 1 de abril de 2018 - Sétimo lançamento público programado; código
- 0.1.6: 1 de março de 2018 - Sexta lançamento público programado; código
- 0.1.5: 1 de fevereiro de 2018 - Quinto lançamento público programado; código
- 0.1.4: 1 de janeiro de 2018 - Quarto lançamento público programado; código
- 0.1.3: 1 de dezembro de 2017 - Terceiro lançamento público programado; código
- 0.1.2: 1 de novembro de 2017 - Segundo lançamento público programado; código
- 0.1.1: 2 de outubro de 2017 - Release de correção de bugs para 0,1,0; código
- 0.1.0: 30 de setembro de 2017 - primeiro lançamento público; código