Lawmate Roumanie est un projet axé sur la création d'un modèle de langue large (LLM) spécialisé dans le domaine juridique roumain. Ce modèle est conçu pour aider à diverses tâches juridiques en comprenant et en générant du texte basé sur des documents juridiques roumains. Le projet utilise le modèle pré-formé Equall / Saul-7B-Instruct-V1 de la bibliothèque de Hugging Face, spécifiquement affiné sur des textes juridiques roumains comme la Constitution et la loi sur l'éducation.
documents/ : Contient des documents texte utilisés pour la formation du modèle, y compris la Constitution roumaine et la loi sur l'éducation.
training_ds/ : contient les fichiers de jeu de données générés à partir des documents texte à des fins de formation.
env_llm.txt : répertorie les dépendances et les paramètres d'environnement requis pour exécuter le projet.
main.py : le script principal pour la formation et l'évaluation du modèle grand langage (LLM).
.gitignore : spécifie les fichiers et les répertoires à ignorer par Git pour garder le référentiel propre.
LawMate Romania/ : comprend le script de chatbot et les captures d'écran démontrant des exemples d'interactions.
Configurer l'environnement :
pip install -r env_llm.txtPréparez les fichiers PDF :
documents/ répertoire.Affiner le modèle :
main.py pour affiner le LLM pré-formé sur l'ensemble de données fourni.Évaluer et enregistrer le modèle :