Este é o repositório para o nosso projeto "Law and Artificial Intelligence" na Northwestern University. O membro da equipe do projeto é Noah Caldwell-Gatsos @NCALDWELL17 , RHETT D'OSOUZA @RHETTDSOUZA13 e LUKAS JUSTEN @LUKAS-JUSTEN .
A aplicação diretamente de avanços no aprendizado de transferência do BERT resulta em baixa precisão em áreas específicas de domínio, como a lei, devido a uma mudança de distribuição de palavras de corpora de domínio geral para corpora específica de domínio. Em nosso projeto, demonstraremos como o modelo de idioma pré-treinado Bert pode ser adaptado a domínios adicionais, como direito contratual ou julgamentos judiciais.
Não criamos e treinamos o modelo, que requer recursos além do escopo do projeto. Em vez disso, o que propomos é uma estrutura para criar um BERT específico do domínio usando contratos legais como um estudo de caso. Essa estrutura abordará por que isso é necessário, que tipo de dados é necessário, como o modelo é treinado e como o desempenho do modelo pode ser avaliado.
Finalmente, construímos um pequeno front -end que permite visualizar a complexidade de um corpora. Esperamos que isso ajudasse outras pessoas a obter informações sobre seus conjuntos de dados e descobrir se faz sentido aplicar Bert ao seu domínio.