Это хранилище нашего проекта «Закон и искусственного интеллекта» в Северо -Западном университете. Членом команды проекта являются Noah Caldwell-Gatsos @ncaldwell17 , Rhett D'Souza @Rhettdsouza13 и Lukas Jouseen @Lukas-Justen .
Непосредственное применение достижений в обучении передачи от BERT приводит к плохой точности в областях, специфичных для доменов, таких как закон из-за перехода распределения слов от корпорации общего домена к корпорации, специфичной для доменов. В нашем проекте мы продемонстрируем, как предварительно обученная языковая модель BERT может быть адаптирована к дополнительным доменам, таким как договорное право или судебные решения.
Мы не создавали и не обучали модель, которая требует ресурсов за пределами масштаба проекта. Вместо этого, мы предлагаем,-это основа для создания специфического для домена BERT с использованием юридических контрактов в качестве тематического исследования. Эта структура расскажет, почему это необходимо, какие данные необходимы, как обучается модель и как можно оценить производительность модели.
Наконец, мы построили небольшой фронт, который позволяет вам визуализировать сложность корпора. Мы надеялись, что это поможет другим людям получить представление о своих наборах данных и выяснить, имеет ли смысл применить BERT к своему домену.