Download do VGLM - download do código -fonte VGLM

VGLM

Código-Fonte de IA

1.0.0

Baixar

Modelo de linguagem generativa versátil

Esta é a implementação do artigo:

Explorando o modelo de linguagem generativa versátil por meio de aprendizado de transferência eficiente em parâmetro . Zhaojiang Lin , Andrea Madotto , Pascale Fung Aschedings of EMNLP 2020 [PDF]

Se você usar qualquer código de origem ou conjuntos de dados incluído neste kit de ferramentas em seu trabalho, cite o documento a seguir. O Bibtex está listado abaixo:

 @Article {lin2020Exploring,
  title = {Explorando o modelo de linguagem generativa versátil por meio de aprendizado de transferência eficiente em parâmetro},
  autor = {Lin, Zhaojiang e Madotto, Andrea and Fung, Pascale},
  Journal = {arxiv pré -impressão arxiv: 2004.03829},
  ano = {2020}
}

Resumo

Modelos de linguagem generativa pré-treinada de ajuste fino para tarefas de geração de idiomas a baixo de fluxo mostraram resultados promissores. No entanto, ele tem o custo de ter um modelo único, grande para cada tarefa, que não é ideal em cenários de baixa memória/potência (por exemplo, móvel). Neste trabalho, propomos uma maneira eficaz de ajustar várias tarefas de geração de fluxo inferior usando simultaneamente um único modelo pré-treinado grande. As experiências em cinco tarefas diversas de geração de idiomas mostram que, apenas usando 2-3% de parâmetros adicionais para cada tarefa, nosso modelo pode manter ou até melhorar o desempenho de ajustar o modelo inteiro.

Modelo de linguagem generativa versátil (VLM):

O Modelo de Linguagem Versátil (VLM) é composto por três componentes: um modelo de backs de idioma pré-treinado (por exemplo, GPT-2) e dois tipos de parâmetros especializados para cada tarefa de geração, como adaptadores residuais de baixo rank e incorporação de tarefas.

Dependência

Verifique os pacotes necessários ou simplesmente execute o comando

 ❱❱❱ pip install -r requirements.txt

Experimentos

Conjunto de dados

Baixe os conjuntos de dados pré -processados

Reprodutibilidade

Fornecemos o ponto de verificação treinado do nosso VLM.

Modelo de teste: escolha uma tarefa em (MT, Summarization, Diálogo, QA, NLG].

 ❱❱❱ python ./evaluate_vlm.py --task mt --no_sample --model_checkpoint $model_path

Tune fina GPT-2

Tradução da máquina de trem:

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json

Tradução da máquina de teste:

 ❱❱❱ python ./evaluate.py --task mt --no_sample --max_history=2 --model_checkpoint runs/$model_checkpoint

Verifique o run.sh para executar outras tarefas

Adaptadores de trem VLM e incorporações de tarefas

Tradução da máquina de trem sem destilação de conhecimento

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json --adapter_bottleneck 300 --lr 0.0005

Tradução da máquina de trem usando o nível de frase Destilação de conhecimento:

 ❱❱❱ python ./sentence_distiller.py --task mt --max_history=2 --model_checkpoint runs/$fully_finetuned_gpt2_checkpoint --no_sample

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json --adapter_bottleneck 300 --lr 0.0005 --distillation

Traslatação da máquina de teste:

 ❱❱❱ python ./evaluate.py --task mt --no_sample --adapter_bottleneck 300 --model_checkpoint runs/$model_checkpoint

Verifique o run.sh para executar outras tarefas

Combine todos os adaptadores e tarefas incorporando em modelo único

Linha 68 de Combine_all.py para fornecer a lista de ponto de verificação

 ❱❱❱ python combine_all.py

Teste para ver se o resultado é o mesmo

 ❱❱❱ python ./evaluate_vlm.py --task mt --no_sample --model_checkpoint $model_path

Os scripts acima ilustram como treinar VLM continuamente quando as tarefas chegam sequencialmente.

Treinamento multitarefa VLM

Quando todas as tarefas disponíveis ao mesmo tempo.

 ❱❱❱ python ./train_vlm.py --gradient_accumulation_steps=16 --train_batch_size=1 --valid_batch_size=1 --n_epochs 3

Reconhecimento

Este repositório é implementado base em huggingface

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-08
tamanho 425.49KB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos