Descargar AFTERV1.0 - Descargar código fuente AFTERV1.0

AFTERV1.0

Código Fuente de IA

1.0.0

Descargar

Después de - una faseza de la falta de un egularizador de renta efectiva

Este repositorio contiene código fuente para nuestro documento de hallazgos EMNLP 2020: ajuste fino adversario de dominio como un regularizador efectivo.

Introducción

En este trabajo, proponemos un nuevo tipo de regularizador para el proceso de ajuste de los modelos de lenguaje previos a la aparición (LMS). Identificamos la pérdida de representaciones de dominio general de los LM previos al detrota durante el ajuste fino como una forma de olvido catastrófico . El término adversario actúa como un regularizador que preserva la mayor parte del conocimiento capturado por el LM durante el pretrénmente, evitando el olvido catastrófico.

Modelo

Para abordarlo, ampliamos el proceso estándar de ajuste fino de los LMs previos al metro con un objetivo adversario. Este término de pérdida adicional está relacionado con un clasificador adversario, que discrimina entre las representaciones de texto en dominio y fuera del dominio .

En el dominio : conjunto de datos etiquetado de la tarea ( principal ) en cuestión
Out Dominio : datos no etiquetados de un dominio diferente ( auxiliar )

Minimizamos la pérdida específica de la tarea y al mismo tiempo maximizamos la pérdida del clasificador de dominio utilizando una capa de inversión de gradiente.

La función de pérdida que proponemos es la siguiente:

L _After = L _Main - _Dominio λl

Donde L _Main es la pérdida específica de la tarea y _{el dominio} L, una pérdida de confrontación que hace cumplir la invariancia de las representaciones de texto en diferentes dominios, durante el ajuste. λ es un hiperparámetro sintonizable.

After_fig-1

Resultados

Los experimentos en 4 conjuntos de datos de pegamento (COLA, MRPC, SST-2 y RTE) se centraron en dos LMS de pretrados diferentes (Bert y XLNet) demuestran un rendimiento mejorado sobre el ajuste estándar. Mostramos empíricamente que el término adversario actúa como un regularizador que preserva la mayor parte del conocimiento capturado por el LM durante el pretrénmente, evitando el olvido catastrófico.

Requisitos previos

Dependencias

Python 3.6
Pytorch 1.1.0
Numpy 1.16.4
Transformers 2.5.2
Sklearn 0.0

Requisitos de instalación

Crear entorno (opcional): idealmente, debe crear un entorno para el proyecto.

 conda create -n after_env python=3.6
conda activate after_env

Instale Pytorch 1.1.0 con la versión CUDA deseada si desea usar la GPU:

 conda install pytorch==1.1.0 torchvision -c pytorch

Clon el proyecto:

 git clone https://github.com/GeorgeVern/AFTERV1.0.git
cd AFTERV1.0

Luego instale el resto de los requisitos:

 pip install -r requirements.txt

Descargar datos

Datos principales

Para descargar los conjuntos de datos principales , usamos el script download_glue_data.py desde aquí. Puede elegir los conjuntos de datos utilizados en el documento ejecutando el siguiente comando:

 python download_glue_data.py --data_dir './Datasets' --tasks 'CoLA,SST,RTE,MRPC

La ruta predeterminada para los conjuntos de datos es Afterv1.0/DataSets, pero se puede usar cualquier otra ruta (debería estar de acuerdo con la ruta DATA_DIR especificada en el script sys_config )

Datos auxiliares

Como datos auxiliares usamos corpus de varios dominios. Proporcionamos scripts para descargar y preprocesar los corpus utilizados en nuestros experimentos, mientras que cualquier otro corporativo también puede usarse.

Después de - ajuste un modelo previo

Para ejecutar después con Bert, necesita el siguiente comando:

 python after_fine-tune.py -i afterBert_finetune_cola_europarl --lambd 0.1

lambd se refiere a Lambda, el peso de la función de pérdida de articulaciones que usamos.

En configs/ , puede ver una lista de archivos YAML que utilizamos para los experimentos y también puede cambiar sus hiperparámetros.

Referencia

Si usa este repositorio en su investigación, cite el documento:

 @inproceedings{vernikos-etal-2020-domain,
    title = "{D}omain {A}dversarial {F}ine-{T}uning as an {E}ffective {R}egularizer",
    author = "Vernikos, Giorgos  and
      Margatina, Katerina  and
      Chronopoulou, Alexandra  and
      Androutsopoulos, Ion",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    year = "2020",
    url = "https://www.aclweb.org/anthology/2020.findings-emnlp.278",
    doi = "10.18653/v1/2020.findings-emnlp.278",
    pages = "3103--3112",
}

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-06-13
tamaño 119.89KB
Proviene de Github

Aplicaciones relacionadas

versión mfhzcc5.0

2024-07-24
licuadora4.0

2024-02-21
Rufus4.0

2024-02-21
Aplicación Pequeños Tigres 3.0

2024-02-18
jmcomicron.mic2.0

2024-01-09
Indy9.0.Rutina

2009-05-29

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
promptl

Código Fuente de IA

1.0.0
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Otro código fuente

1.0.0

Información relacionada Todo