Download AFTERV1.0 - AFTERV1.0 Download de código -fonte

AFTERV1.0

Código-Fonte de IA

1.0.0

Baixar

Depois de - um dversário , a falta como um egulizador efetivo

Este repositório contém código-fonte para o nosso artigo de descobertas do EMNLP 2020: Domínio Adversarial Tuneamento fino como um regularizador eficaz.

Introdução

Neste trabalho, propomos um novo tipo de regularizador para o processo de ajuste fino dos modelos de idiomas pré-treinados (LMS). Identificamos a perda de representações de domínio geral do LMS pré-terenciado durante o ajuste fino como uma forma de esquecimento catastrófico . O termo adversário atua como um regularizador que preserva a maior parte do conhecimento capturado pelo LM durante o pré -treinamento, impedindo o esquecimento catastrófico.

Modelo

Para abordá-lo, estendemos o processo de ajuste fino padrão de LMS pré-treinamento com um objetivo contraditório. Esse termo de perda adicional está relacionado a um classificador adversário, que discrimina entre representações de texto no domínio e fora do domínio .

No domínio : conjunto de dados rotulado da tarefa ( principal ) em questão
Fora do domínio : dados não marcados de um domínio diferente ( auxiliar )

Minimizamos a perda específica da tarefa e, ao mesmo tempo, maximiza a perda do classificador de domínio usando uma camada de reversão de gradiente.

A função de perda que propomos é a seguinte:

L _após = l _main - λl _domínio

Onde L _Main é a perda específica da tarefa e _{o domínio} L uma perda adversária que aplica invariância das representações de texto em diferentes domínios, enquanto o ajuste fino. λ é um hiperparâmetro ajustável.

Depois_fig-1

Resultados

Experimentos em 4 conjuntos de dados de cola (Cola, MRPC, SST-2 e RTE) com dois LMs pré-treinados diferentes (BERT e XLNET) demonstram melhor desempenho em relação ao ajuste fino padrão. Mostramos empiricamente que o termo adversário atua como um regularizador que preserva a maior parte do conhecimento capturado pelo LM durante o pré -treinamento, impedindo o esquecimento catastrófico.

Pré -requisitos

Dependências

Python 3.6
Pytorch 1.1.0
Numpy 1.16.4
Transformers 2.5.2
Sklearn 0.0

Instale requisitos

Criar ambiente (opcional): Idealmente, você deve criar um ambiente para o projeto.

 conda create -n after_env python=3.6
conda activate after_env

Instale o Pytorch 1.1.0 com a versão CUDA desejada, se desejar usar a GPU:

 conda install pytorch==1.1.0 torchvision -c pytorch

Clone o projeto:

 git clone https://github.com/GeorgeVern/AFTERV1.0.git
cd AFTERV1.0

Em seguida, instale o restante dos requisitos:

 pip install -r requirements.txt

Baixar dados

Dados principais

Para baixar os principais conjuntos de dados, usamos o script download_glue_data.py aqui. Você pode escolher os conjuntos de dados usados no artigo executando o seguinte comando:

 python download_glue_data.py --data_dir './Datasets' --tasks 'CoLA,SST,RTE,MRPC

O caminho padrão para os conjuntos de dados é Afterv1.0/conjuntos de dados, mas qualquer outro caminho pode ser usado (deve concordar com o caminho DATA_DIR especificado no script sys_config )

Dados auxiliares

Como dados auxiliares, usamos corpora de vários domínios. Fornecemos scripts para baixar e pré -processar os corpora usados em nossos experimentos, enquanto qualquer outro corpora também pode ser usado.

Depois - ajuste um modelo pré -terenciado

Para correr depois com Bert, você precisa do seguinte comando:

 python after_fine-tune.py -i afterBert_finetune_cola_europarl --lambd 0.1

lambd refere -se ao Lambda, o peso da função de perda articular que usamos.

Em configs/ , você pode ver uma lista de arquivos YAML que usamos para as experiências e também pode alterar seus hiperparâmetros.

Referência

Se você usar este repositório em sua pesquisa, cite o artigo:

 @inproceedings{vernikos-etal-2020-domain,
    title = "{D}omain {A}dversarial {F}ine-{T}uning as an {E}ffective {R}egularizer",
    author = "Vernikos, Giorgos  and
      Margatina, Katerina  and
      Chronopoulou, Alexandra  and
      Androutsopoulos, Ion",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    year = "2020",
    url = "https://www.aclweb.org/anthology/2020.findings-emnlp.278",
    doi = "10.18653/v1/2020.findings-emnlp.278",
    pages = "3103--3112",
}

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-06-13
tamanho 119.89KB
Vindo de Github

Aplicativos Relacionados

versão mfhzcc5.0

2024-07-24
Liquidificador4.0

2024-02-21
Rufus4.0

2024-02-21
Aplicativo Pequenos Tigres 3.0

2024-02-18
jmcomicron.mic2.0

2024-01-09
Indy9.0.Rotina

2009-05-29

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
promptl

Código-Fonte de IA

1.0.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0

Informações Relacionadas Todos