Téléchargement AFTERV1.0 - Téléchargement du code source AFTERV1.0

AFTERV1.0

Code Source AI

1.0.0

Télécharger

Après - un fin- t ingénant comme un e ffective

Ce référentiel contient le code source de notre document de découvertes EMNLP 2020: le réglage adversaire du domaine en tant que régularisateur efficace.

Introduction

Dans ce travail, nous proposons un nouveau type de régularisateur pour le processus de réglage fin des modèles de langue pré-entraînés (LMS). Nous identifions la perte de représentations du domaine général des LMS pré-entraînés lors du réglage fin comme une forme d' oubli catastrophique . Le terme contradictoire agit comme un régulariseur qui préserve la plupart des connaissances capturées par le LM pendant la pré-entraînement, empêchant l'oubli catastrophique.

Modèle

Pour y remédier, nous étendons le processus de réglage fin standard de LMS pré-entraîné avec un objectif contradictoire. Ce terme de perte supplémentaire est lié à un classificateur contradictoire, qui discrimine les représentations de texte dans le domaine et hors du domaine .

Dans le domaine : ensemble de données étiqueté de la tâche ( principale ) à portée de main
Hors du domaine : données non marquées d'un domaine différent ( auxiliaire )

Nous minimisons la perte spécifique à la tâche et maximions en même temps la perte du classificateur de domaine à l'aide d'une couche d'inversion de gradient.

La fonction de perte que nous proposons est la suivante:

L _après = l _{du domaine} _principal - λl

où L _Main est la perte spécifique à la tâche et le _domaine L une perte adversaire qui applique l'invariance des représentations de texte dans différents domaines, tout en réglant. λ est un hyperparamètre accordable.

Après_fig-1

Résultats

Des expériences sur 4 ensembles de données de colle (COLA, MRPC, SST-2 et RTE) avec deux LMS pré-entraînés différents (Bert et XLNET) montrent des performances améliorées sur un réglage fin standard. Nous montrons empiriquement que le terme contradictoire agit comme un régulariseur qui préserve la plupart des connaissances capturées par le LM pendant la pré-formation, empêchant l'oubli catastrophique.

Condition préalable

Dépendances

Python 3.6
Pytorch 1.1.0
Numpy 1.16.4
Transformers 2.5.2
Sklearn 0.0

Installer les exigences

Créer un environnement (facultatif): Idéalement, vous devez créer un environnement pour le projet.

 conda create -n after_env python=3.6
conda activate after_env

Installez Pytorch 1.1.0 avec la version CUDA souhaitée si vous souhaitez utiliser le GPU:

 conda install pytorch==1.1.0 torchvision -c pytorch

Clone le projet:

 git clone https://github.com/GeorgeVern/AFTERV1.0.git
cd AFTERV1.0

Installez ensuite le reste des exigences:

 pip install -r requirements.txt

Télécharger les données

Données principales

Pour télécharger les ensembles de données principaux , nous utilisons le script download_glue_data.py à partir d'ici. Vous pouvez choisir les ensembles de données utilisés dans le papier en exécutant la commande suivante:

 python download_glue_data.py --data_dir './Datasets' --tasks 'CoLA,SST,RTE,MRPC

Le chemin par défaut pour les ensembles de données est après V1.0 / ensembles de données, mais tout autre chemin peut être utilisé (devrait être d'accord avec le chemin DATA_DIR spécifié dans le script sys_config )

Données auxiliaires

En tant que données auxiliaires , nous utilisons les corpus à partir de divers domaines. Nous fournissons des scripts pour télécharger et prétraiter les corpus utilisés dans nos expériences, tandis que tout autre corporat peut également être utilisé.

Après - affiner un modèle pré-entraîné

Pour exécuter après Bert, vous avez besoin de la commande suivante:

 python after_fine-tune.py -i afterBert_finetune_cola_europarl --lambd 0.1

lambd fait référence à Lambda, le poids de la fonction de perte articulaire que nous utilisons.

Dans configs/ , vous pouvez voir une liste de fichiers YAML que nous avons utilisés pour les expériences et peut également modifier leurs hyperparamètres.

Référence

Si vous utilisez ce dépôt dans votre recherche, veuillez citer le document:

 @inproceedings{vernikos-etal-2020-domain,
    title = "{D}omain {A}dversarial {F}ine-{T}uning as an {E}ffective {R}egularizer",
    author = "Vernikos, Giorgos  and
      Margatina, Katerina  and
      Chronopoulou, Alexandra  and
      Androutsopoulos, Ion",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    year = "2020",
    url = "https://www.aclweb.org/anthology/2020.findings-emnlp.278",
    doi = "10.18653/v1/2020.findings-emnlp.278",
    pages = "3103--3112",
}

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-06-13
taille 119.89KB
Provenant de Github

Applications connexes

version mfhzcc5.0

2024-07-24
Mélangeur4.0

2024-02-21
Rufus4.0

2024-02-21
Application Petits Tigres3.0

2024-02-18
jmcomicron.mic2.0

2024-01-09
Indy9.0.Routine

2009-05-29

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
promptl

Code Source AI

1.0.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0

Actualités connexes Tout