Téléchargement COCO LM - Téléchargement du code source COCO LM

COCO LM

Code Source AI

v0.1.0

Télécharger

Coco-lm

Ce référentiel contient les scripts pour les modèles pré-entraînés par Coco-LM raffinés sur des repères Glue et Squad 2.0.

Papier: Coco-LM: Correction et séquences de texte contrastées pour le modèle de langue pré-formation

Aperçu

Nous fournissons les scripts en deux versions, sur la base de deux bases de code open source largement utilisées, de la bibliothèque Fairseq et de la bibliothèque de transformateurs HuggingFace. Les deux versions de code sont principalement équivalentes en fonctionnalité, et vous êtes libre de les utiliser. Cependant, nous notons que la version Fairseq est ce que nous avons utilisé dans nos expériences, et elle reproduira mieux les résultats dans le papier; La version HuggingFace est implémentée plus tard pour assurer la compatibilité avec la bibliothèque HuggingFace Transformers et peut donner des résultats légèrement différents.

Veuillez suivre les fichiers ReadMe sous les deux répertoires pour exécuter le code.

Collez des résultats fins

La référence d'évaluation générale de la compréhension du langage (GLUE) est une collection de tâches de compréhension du langage des phrases ou des phrases pour évaluer et analyser les systèmes de compréhension du langage naturel.

Les résultats de fonction de développement de la base de la base coco-lm ++ et les grands modèles ++ sont les suivants (médiane de 5 graines aléatoires différentes):

Modèle	MNLI-M / MM	QQP	QNLI	SST-2	Cola	Rte	MRPC	STS-B	AVG
Coco-lm base ++	90.2 / 90.0	92.2	94.2	94.6	67.3	87.4	91.2	91.8	88.6
Coco-lm grand ++	91.4 / 91.6	92.8	95.7	96.9	73.9	91.0	92.2	92.7	90.8

Les résultats des tests de colle de Coco-LM Base ++ et les grands modèles ++ sont les suivants (pas d'ensemble, astuces spécifiques à la tâche, etc.):

Modèle	MNLI-M / MM	QQP	QNLI	SST-2	Cola	Rte	MRPC	STS-B	AVG
Coco-lm base ++	89.8 / 89.3	89.8	94.2	95.6	68.6	82.3	88.5	90.3	87.4
Coco-lm grand ++	91.6 / 91.1	90.5	95.8	96.7	70.5	89.2	88.4	91.8	89.3

Squad 2.0 Résultats du réglage fin

La question de la question de Stanford répondant à un ensemble de données (Squad) est un ensemble de données de compréhension en lecture, composé de questions posées par des travailleurs de mi-temps sur un ensemble d'articles de Wikipedia, où la réponse à chaque question est un segment de texte, ou de portée, du passage de lecture correspondant, ou de la question pourrait être incomparable.

Squad 2.0 Dev set Resseaux Résultats de Coco-LM Base ++ et de grands modèles ++ sont les suivants (médiane de 5 graines aléatoires différentes):

Modèle	Em	F1
Coco-lm base ++	85.4	88.1
Coco-lm grand ++	88.2	91.0

Citation

Si vous trouvez le code et les modèles utiles pour vos recherches, veuillez citer l'article suivant:

 @inproceedings{meng2021cocolm,
  title={{COCO-LM}: Correcting and contrasting text sequences for language model pretraining},
  author={Meng, Yu and Xiong, Chenyan and Bajaj, Payal and Tiwary, Saurabh and Bennett, Paul and Han, Jiawei and Song, Xia},
  booktitle={Conference on Neural Information Processing Systems},
  year={2021}
}

Contributif

Ce projet accueille les contributions et les suggestions. La plupart des contributions vous obligent à accepter un accord de licence de contributeur (CLA) déclarant que vous avez le droit de faire et en fait, accordez-nous les droits d'utilisation de votre contribution. Pour plus de détails, visitez https://cla.opensource.microsoft.com.

Lorsque vous soumettez une demande de traction, un bot CLA déterminera automatiquement si vous devez fournir un CLA et décorer le RP de manière appropriée (par exemple, vérification d'état, commentaire). Suivez simplement les instructions fournies par le bot. Vous n'aurez besoin de le faire qu'une seule fois sur tous les dépositions en utilisant notre CLA.

Ce projet a adopté le code de conduite open source Microsoft. Pour plus d'informations, consultez le code de conduite FAQ ou contactez [email protected] avec toute question ou commentaire supplémentaire.

Développer

Informations supplémentaires

Version v0.1.0
Type Code Source AI
Date de mise à jour 2025-09-06
taille 4.43MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Application de collecte d'assistants de vie COCO

2023-06-07
Production de pages Web de confession en ligne LM Code source PHP version embellie version officielle

2022-11-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout