Law OMNI BERT Project
1.0.0
這是我們西北大學“法律和人工智能”項目的存儲庫。該項目的團隊成員是Noah Caldwell-Gatsos @ncaldwell17 ,Rhett D'Souza @Rhettdsouza13和Lukas Justen @Lukas-Justen 。
直接從BERT進行轉移學習中的進步導致在特定領域(如法律)等領域的準確性較差,因為單詞分佈從一般域語料庫轉移到特定於領域的COLPORA。在我們的項目中,我們將展示如何將預培訓的語言模型BERT適應其他領域,例如合同法或法院判決。
我們沒有創建和訓練模型,這需要超出項目範圍的資源。取而代之的是,我們建議的是通過使用法律合同作為案例研究來創建特定領域的BERT的框架。該框架將涵蓋為什麼必要的,需要什麼樣的數據,如何訓練模型以及如何評估模型的性能。
最後,我們建立了一個小的前端,使您能夠可視化語料庫的複雜性。我們希望這將幫助其他人洞悉其數據集,並弄清楚將BERT應用於其領域是否有意義。