Este es el repositorio de nuestro proyecto de "ley e inteligencia artificial" en la Universidad Northwestern. El miembro del equipo del proyecto es Noah Caldwell-Gatsos @NCaldwell17 , Rhett D'Souza @Rhettdsouza13 y Lukas Justen @Lukas-Justen .
La aplicación directa de avances en el aprendizaje de transferencia de Bert da como resultado una precisión de mala precisión en áreas específicas de dominio como la ley debido a un cambio de distribución de palabras de corpus de dominio general a corpus específicos de dominio. En nuestro proyecto, demostraremos cómo el modelo de lenguaje previamente capacitado Bert puede adaptarse a dominios adicionales, como el derecho contractual o los juicios judiciales.
No creamos y capacitamos al modelo, que requiere recursos más allá del alcance del proyecto. En cambio, lo que proponemos es un marco para crear un BERT específico de dominio mediante el uso de contratos legales como estudio de caso. Este marco cubrirá por qué esto es necesario, qué tipo de datos son necesarios, cómo se capacita el modelo y cómo se puede evaluar el rendimiento del modelo.
Finalmente, construimos una pequeña frontend que le permite visualizar la complejidad de un corpus. Esperamos que esto ayudara a otras personas a obtener información sobre sus conjuntos de datos y descubrir si tiene sentido aplicar Bert a su dominio.