lawma Download lawma Download

lawma

Code Source AI

1.0.0

Télécharger

Lawma: le pouvoir de la spécialisation pour les tâches juridiques

Ceci est la base de code principale du projet:

Lawma: le pouvoir de la spécification des tâches juridiques. Ricardo Dominguez-Olmedo et Vedant Nanda et Rediet Abebe et Stefan Bechtold et Christoph Engel et Jens Frankenreiter et Krishna Gummadi et Moritz Hardt et Michael Livermore. 2024

Lawma 8b et Lawma 70b sont des modèles linguistiques affinés sur 260 tâches de classification juridique dérivées des bases de données de la Cour suprême de la Cour suprême et de la Cour d'appel. Les modèles Lawma surpassent le GPT-4 sur 95% de ces tâches de classification juridique, en moyenne de plus de 17 points de précision.

Les modèles : Lawma 8b et Lawma 70b sont des tonnes fines de Llama 3 instruct.
L'ensemble de données à réglage fin : notre ensemble de données à réglage fin contient un ensemble diversifié de 260 tâches de classification juridique, avec environ 500 000 exemples de tâches et 2 milliards de jetons.
Les tâches de classification juridique : ils comprennent presque toutes les variables de la Cour suprême et des bases de données de la Cour d'appel de Songer, voir l'annexe B.
Les détails : consultez notre préimpression ARXIV pour plus de détails, y compris un certain nombre d'expériences de réglage fin sur le comportement de mise à l'échelle du réglage fin, son efficacité de l'échantillon, sa généralisation aux tâches et aux tribunaux invisibles, et à l'effet de la spécialisation des tâches unique.

À quoi servent les modèles Lawma? Nous vous recommandons d'utiliser les modèles Lawma uniquement pour les tâches de classification juridique sur lesquelles les modèles ont été affinés. La principale prise de notre article est que des modèles spécialisés conduisent à une amélioration importante des performances. Par conséquent, nous recommandons fortement aux praticiens de s'adapter davantage sur les tâches réelles pour lesquelles les modèles seront utilisés. Relativement peu d'exemples --ie, des dizaines ou des centaines - peuvent déjà conduire à de gros gains de performance.

Pourquoi ces tâches de classification légale? Nos raisons d'étudier les tâches de classification légale sont à la fois techniques et substantielles. Du point de vue technique de l'apprentissage automatique, ces tâches fournissent des problèmes de classification hautement non triviaux où même les meilleurs modèles laissent beaucoup de place à l'amélioration. D'un point de vue juridique substantiel, des solutions efficaces à ces problèmes de classification ont des applications riches et importantes dans la recherche juridique. Nous fournissons du code pour évaluer les performances des modèles HF sur ces tâches de classification.

Évaluation

Pour évaluer les modèles de langue sur chacune des 260 tâches juridiques, veuillez vous référer au dossier d'évaluation, et en particulier hf_eval.py. Vous devez d'abord télécharger les fichiers de tâche à partir d'ici, ou les générer vous-même en suivant les instructions dans le dossier Data_generation. Nous avons évalué une gamme de modèles de langue:

Modèle	Toutes les tâches	Tâches de la Cour suprême	Tâches de la Cour d'appel
Lawma 70b	81.9	84.1	81.5
Lawma 8b	80.3	82.4	79.9
Gpt4	62.9	59.8	63.4
Lama 3 70b Inst	58.4	47.1	60.3
Mixtral 8x7b inst	43.2	24.4	46.4
Lama 3 8b Inst	42.6	32.8	44.2
Classificateur majoritaire	41.7	31.5	43.5
Mistral 7b Inst	39.9	19.5	43.4
Saul 7b Inst	34.4	20.2	36.8
Legalbert	24.6	13.6	26.4

Les modèles Lawma surpassent considérablement tous les autres modèles testés, et en particulier GPT-4. Notez que, bien que Lawma 70b surpasse généralement Lawma 8b, la différence de performance est généralement plutôt petite. Par conséquent, les praticiens peuvent préférer utiliser Lawma 8b pour son inférence beaucoup moins chère et son réglage fin, avec peu de coût en termes de performance du modèle.

Remarque: L'évaluation des modèles sur les 260 tâches de classification est raisonnablement intensive en calcul. Cependant, aux fins de l'analyse comparative du modèle de langue, nous pouvons être principalement intéressés par les performances agrégées. Nous travaillons actuellement sur la réalisation d'évaluations agrégées moins de ressources en considérant uniquement un nombre limité d'exemples par tâche.

Affinage sur notre ensemble de données

Nous affinons Lawma en utilisant la bibliothèque axolotl. Veuillez vous référer à la lecture dans le dossier Fine-Tune pour les scripts de formation et les fichiers de configuration que nous avons utilisés pour affiner Lawma.

Pour affiner notre ensemble de données de tâches de classification légale, indiquez simplement dans votre fichier config.yml :

 datasets :
  - path : ricdomolm/lawma-all-tasks
    type : alpaca

puis entraînez-vous en utilisant l'axolotl comme d'habitude

accelerate launch -m axolotl.cli.train config.yml

Les GPU de 7xh100 à réglage fin sur 7xh100 ont nécessité un total de 600 H100 heures (3 époques), tandis que la loi finale de la loi 70b sur 8 h100 de 8 GPU nécessitait chacune environ 1600 H100 heures (1 époque). Nous constatons que d'autres époques nuisent à la performance moyenne des tâches.

Reproduire les expériences et les figures du papier

Pour reproduire les résultats du papier, prenez les mesures suivantes:

Accédez à DATA_GENERATION pour tout le code pour créer les tâches de classification et l'ensemble de données de réglage fin.
L'évaluation du répertoire contient le code utilisé pour évaluer divers modèles sur les tâches de classification.
Le répertoire affinée contient du code pour affiner Lawma, ainsi que les expériences de réglage fin supplémentaires incluses dans le document.
Les ordinateurs portables contiennent des fichiers IPYNB pour générer les tracés et les tableaux du papier.

Voir les fichiers readme.md dans les sous-répertoires pour une documentation supplémentaire.

Citation

Veuillez citer comme:

 @misc{dominguezolmedo2024lawmapowerspecializationlegal,
      title={Lawma: The Power of Specialization for Legal Tasks}, 
      author={Ricardo Dominguez-Olmedo and Vedant Nanda and Rediet Abebe and Stefan Bechtold and Christoph Engel and Jens Frankenreiter and Krishna Gummadi and Moritz Hardt and Michael Livermore},
      year={2024},
      eprint={2407.16615},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2407.16615}, 
}

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-09
taille 393.24MB
Provenant de Github

Applications connexes

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout