Ceci est le référentiel de notre projet "Law and Artificial Intelligence" à la Northwestern University. Le membre de l'équipe du projet est Noah Caldwell-gatsos @ ncaldwell17 , rhett D'souza @ rhettdSouza13 et Lukas Justen @ Lukas-justen .
L'application directe des progrès de l'apprentissage du transfert de Bert se traduit par une mauvaise précision dans les domaines spécifiques au domaine comme le droit en raison d'un passage de distribution de mots des corpus de domaine général aux corpus spécifiques au domaine. Dans notre projet, nous montrerons comment le modèle de langue pré-formé Bert peut être adapté à des domaines supplémentaires, tels que le droit des contrats ou les jugements judiciaires.
Nous n'avons pas créé et formé le modèle, qui nécessite des ressources au-delà de la portée du projet. Au lieu de cela, ce que nous proposons est un cadre pour créer un Bert spécifique au domaine en utilisant des contrats juridiques comme étude de cas. Ce cadre couvrira pourquoi cela est nécessaire, quel type de données est nécessaire, comment le modèle est formé et comment les performances du modèle peuvent être évaluées.
Enfin, nous avons construit un petit frontend qui vous permet de visualiser la complexité des corpus. Nous espérions que cela aidera d'autres personnes à mieux comprendre leurs ensembles de données et à déterminer s'il est logique d'appliquer Bert à leur domaine.