Legal LLM
1.0.0
罗马尼亚议员是一个旨在创建专门从事罗马尼亚法律领域的大型语言模型(LLM)的项目。该模型旨在通过根据罗马尼亚法律文件理解和生成文本来协助各种法律任务。该项目使用拥抱Face图书馆的Equall/Saul-7B-Instruct-V1预先训练的模型,该模型特别对宪法和教育法等罗马尼亚法律文本进行了微调。
documents/ :包含用于培训模型的文本文档,包括罗马尼亚宪法和教育法。
training_ds/ :包含用于培训目的的文本文档生成的数据集文件。
env_llm.txt :列出运行项目所需的依赖关系和环境设置。
main.py :培训和评估大语言模型(LLM)的主要脚本。
.gitignore :指定git忽略的文件和目录,以保持存储库清洁。
LawMate Romania/ :包括聊天机器人脚本和屏幕截图,展示了示例互动。
设置环境:
pip install -r env_llm.txt准备PDF文件:
documents/目录中。微调模型:
main.py以微调提供的数据集上的预训练的LLM。评估并保存模型: