هذا هو المستودع لمشروع "القانون والذكاء الاصطناعي" في جامعة نورث وسترن. عضو الفريق في المشروع هو Noah Caldwell-Gatsos @Ncaldwell17 ، و Rhett d'Souza @rhettouza13 و Lukas Justen @Lukas-Justen .
يؤدي تطبيق التطورات مباشرة في التعلم النقل من BERT إلى ضعف الدقة في المجالات الخاصة بالمجال مثل القانون بسبب تحول توزيع الكلمات من شركة المجال العامة إلى الشركات الخاصة بالمجال. في مشروعنا ، سوف نوضح كيف يمكن تكييف نموذج اللغة اللغوية المسبق قبل تدريبه مع مجالات إضافية ، مثل قانون العقود أو الأحكام في المحكمة.
لم ننشئ النموذج وتدريبه ، والذي يتطلب موارد خارج نطاق المشروع. بدلاً من ذلك ، ما نقترحه هو إطار لإنشاء BERT خاص بالمجال باستخدام العقود القانونية كدراسة حالة. سيغطي هذا الإطار سبب ضرورة ذلك ، ونوع البيانات الضروري ، وكيفية تدريب النموذج ، وكيف يمكن تقييم أداء النموذج.
أخيرًا ، قمنا ببناء واجهة أمامية صغيرة تتيح لك تصور تعقيد شركة. كنا نأمل أن يساعد ذلك الآخرين على اكتساب نظرة ثاقبة على مجموعات البيانات الخاصة بهم ومعرفة ما إذا كان من المنطقي تطبيق Bert على مجالهم.