Bitune
1.0.0

Bitune: Tuneamento de instrução bidirecional
[ Paper ] [ Website ]
Esse código -fonte contém a implementação do Bitune e é suficiente reproduzir os resultados do artigo. Observe que foi usado para explorar idéias diferentes, e muitos componentes têm nomes diferentes ou se referem a conceitos não mencionados no artigo.
Planejamos lançar um repositório limpo para o Bitune em um futuro próximo.
O Diretório de lm-evaluation-harness contém o repositório de Eleutherai/LM-Evaluation-Harness, adaptado ao nosso método. Você pode instalá -lo com o seguinte comando:
pip install -e lm-evaluation-harnesscommon_0.sh .wandb para registro. Atualizar a linha 57 do eval.py com seu nome de usuário wandb . instruct.sh .downstream.sh . Certifique -se de definir o número correto de etapas de atualização (com base nos valores fornecidos no apêndice) e descomentar as linhas apropriadas para o nome do conjunto de dados, avaliações (na parte inferior) e o nome do método.ablations.sh e execute o script. models :pass_scale_k , pass_scale_v ).enforce_bidir da função forward() .forward() responsável por chamar o wrapper Bitune ._pass_fn() no arquivo passes.py ):pass_scale_k , pass_scale_v ).peft define adaptadores inativos como não transíveis.PassScale classe definido em models/think_gemma.py ):forward() Função que aplica a operação de mistura com base na variante especificada na configuração ( config.pass_type ). Nosso método final é definido pela variante 607 (a usada para experimentos) e sua versão 801 simplificada. As seguintes versões das bibliotecas foram usadas:
transformers==4.38.2peft==0.11.1datasets==2.18.0evaluate==0.4.0 @misc { kopiczko2024bitune ,
title = { Bitune: Bidirectional Instruction-Tuning } ,
author = { Dawid J. Kopiczko and Tijmen Blankevoort and Yuki M. Asano } ,
year = { 2024 } ,
eprint = { 2405.14862 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
}