Lawmate Rumania es un proyecto centrado en crear un modelo de lenguaje grande (LLM) especializado en el dominio legal rumano. Este modelo está diseñado para ayudar con diversas tareas legales mediante la comprensión y la generación de texto basado en documentos legales rumanos. El proyecto utiliza el modelo previamente capacitado Equall/Saul-7B-Instruct-V1 de Hugging Face's Biblioteca, específicamente ajustado en textos legales rumanos como la Constitución y la Ley de Educación.
documents/ : Contiene documentos de texto utilizados para capacitar al modelo, incluida la constitución rumana y la ley de educación.
training_ds/ : contiene los archivos del conjunto de datos generados a partir de los documentos de texto para fines de capacitación.
env_llm.txt : enumera las dependencias y la configuración del entorno necesarias para ejecutar el proyecto.
main.py : el script principal para capacitar y evaluar el modelo de lenguaje grande (LLM).
.gitignore : especifica archivos y directorios que serán ignorados por Git para mantener limpio el repositorio.
LawMate Romania/ : incluye el guión de chatbot y las capturas de pantalla que demuestran interacciones de ejemplo.
Configurar el entorno :
pip install -r env_llm.txtPrepare los archivos PDF :
documents/ directorio.Ajuste el modelo :
main.py para ajustar el LLM previamente capacitado en el conjunto de datos proporcionado.Evaluar y guardar el modelo :