Das Gesetz über Gesetze Rumänien ist ein Projekt, das sich auf die Schaffung eines auf den rumänischen Rechtsbereichs spezialisierten großen Sprachmodells (LLM) konzentriert. Dieses Modell soll verschiedene Rechtsaufgaben durch Verständnis und Generierung von Text basierend auf rumänischen Rechtsdokumenten unterstützen. Das Projekt verwendet das Equall/Saul-7b-Instruct-V1- Vorausgebildete Modell aus der Bibliothek von Hugging Face, insbesondere in rumänischen juristischen Texten wie der Verfassung und dem Bildungsgesetz.
documents/ : Enthält Textdokumente, die zur Schulung des Modells verwendet werden, einschließlich der rumänischen Verfassung und des Bildungsgesetzes.
training_ds/ : Enthält die Datensatzdateien, die aus den Textdokumenten für Schulungszwecke generiert wurden.
env_llm.txt : Listet die Abhängigkeiten und Umgebungseinstellungen auf, die für die Ausführung des Projekts erforderlich sind.
main.py : Das Hauptskript zum Training und zur Bewertung des großen Sprachmodells (LLM).
.gitignore : Gibt Dateien und Verzeichnisse an, die von Git ignoriert werden sollen, um das Repository sauber zu halten.
LawMate Romania/ : Enthält das Chatbot -Skript und Screenshots, die Beispielinteraktionen demonstrieren.
Richten Sie die Umgebung ein :
pip install -r env_llm.txtBereiten Sie die PDF -Dateien vor :
documents/ Verzeichnissen.Feinabstimmung das Modell :
main.py aus, um die vorgeborene LLM auf dem bereitgestellten Datensatz zu optimieren.Bewerten und speichern Sie das Modell :