language_modeling_via_stochastic_processes Télécharger - language_modeling_via_stochastic

language_modeling_via_stochastic_processes

Code Source AI

1.0.0

Télécharger

Modélisation du langage via des processus stochastiques

[Document] [Revue ouverte] [Vidéo longue]

ICLR oral 2022

Rose E Wang, Esin Durmus, Noah Goodman, Tatsunori Hashimoto

Introduction

Résumé: Les modèles de langue moderne peuvent générer des textes courts de haute qualité. Cependant, ils serpentent souvent ou sont incohérents lors de la génération de textes plus longs. Ces problèmes découlent de l'objectif de modélisation du langage uniquement uniquement token. Des travaux récents dans l'apprentissage auto-levé suggèrent que les modèles peuvent apprendre de bonnes représentations latentes via un apprentissage contrastif, qui peut être efficace pour les tâches discriminantes. Notre travail analyse l'application de représentations contrastives pour les tâches génératives, comme la longue génération de texte. Nous proposons une approche pour tirer parti des représentations contrastives, que nous appelons le contrôle du temps (TC). TC apprend d'abord une représentation contrastive du domaine de texte cible, puis génère du texte en décodant ces représentations. Par rapport aux méthodes spécifiques au domaine et au réglage fin GPT2 dans une variété de domaines de texte, TC fonctionne de manière compétitive à des méthodes spécifiques pour l'apprentissage des représentations de phrases sur la cohérence du discours. Sur les paramètres longs de la génération de texte, TC préserve la structure du texte à la fois en termes de commande (jusqu'à + 15% mieux) et de cohérence de longueur de texte (jusqu'à + 90% de mieux).

Contenu:

Installation
Ensembles de données
Encodeur
Décodeur
Génération
Analyse

Installation

Suivez les commandes dans setup.sh
Assurez-vous que vous êtes dans l'environnement virtuel: conda activate language_modeling_via_stochastic_processes
Installez la version du décodeur de la bibliothèque Transformers:

 cd decoder # enter the decoder repo
pip install -e . # Installing transformers locally; I modified their GPT2 module to take in our learned embeddings for decoding.

Assurez-vous d'avoir un compte WANDB!

Ensembles de données

Ce dépôt contient tous les ensembles de données sauf deux (WikiHow et Recipe NLG) . Les instructions sont ci-dessous.

Les quatre autres ensembles de données sont déjà dans ce dépôt.

Wikihow

L'ensemble de données WikiHow doit être téléchargé à partir de ce lien. Il s'agit d'un fichier PKL qui devrait passer en tant que path/2/repo/data/wikihow/wiki_how_data.pkl .

Wikisection

L'ensemble de données Wikisection utilisé dans ce document est déjà inclus.

Il est venu de ce travail antérieur - en particulier, nous avons utilisé les articles de Wikipedia de la ville anglaise.

Recette nlg

L'ensemble de données NLG recette doit être téléchargé. Téléchargez l'ensemble de données NLG Recette et placez les données sous encoder/data/recipe_nlg .

Tm2

L'ensemble de données TM2 utilisé dans cet article est déjà inclus. Il provient de l'ensemble de données de recherche de restaurants TM2.

Tickettalk

L'ensemble de données Tickettalk utilisé dans cet article est déjà inclus.
Il peut être trouvé comme l'ensemble de données Tickettalk (tous les fichiers JSON).

Encodeur

Avant d'exécuter des expériences, cd encoder/code; source init_env.sh

Dans encoder/code/scripts/run_ou.py , définissez le nom de la variable ckpt_dir dans votre répertoire de point de contrôle.

Le script pour la formation des encodeurs (TC, VAE, Brownien, Infonce) peut être trouvé dans encoder/code/scripts/train_encoders.sh .

Expériences de l'encodeur

Avant d'exécuter des expériences, cd encoder/code; source init_env.sh

Dans encoder/code/scripts/run_discourse.py et encoder/code/src/systems/discourse_system.py , définissez les chemins corrects sur votre répertoire de données et votre repo.

Le script pour exécuter les expériences de cohérence du discours peut être trouvé dans encoder/code/scripts/discourse.sh .

Décodeur

Pour la formation du décodeur, vous devrez être dans decoder/examples/pytorch/language-modeling/ .

Le script pour la formation du décodeur peut être trouvé sur decoder/examples/pytorch/language-modeling/train_encoders.sh . Assurez-vous de modifier la variable path2repo .

Vous devrez modifier les répertoires en votre répertoire de données, le cas échéant, dans run_time_clm.py

Génération

Pour générer des textes, vous devrez être dans decoder/transformers/examples/pytorch/text-generation/ .

Le script pour générer du texte et mesurer les décalages de longueur par coupe se trouvent à decoder/transformers/examples/pytorch/text-generation/toy_wikisection_generation.sh .

Le script pour générer de longs textes peut être trouvé sur decoder/transformers/examples/pytorch/text-generation/long_generation.sh .

Analyse

Pour collecter toutes les mesures, consultez analysis/run_analysis.sh . Vous pouvez exécuter toutes les évaluations avec source analysis/run_analysis.sh .

N'oubliez pas de modifier le nom d'utilisateur Wandb et le nom du projet comme ce que vous avez répertorié dans les expériences de l'encodeur et du décodeur.

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-07
taille 109.1MB
Provenant de Github

Applications connexes

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Chien_Renard_Lapin

2022-08-01
Moteur d'analyse de données Lihua version gratuite 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout