LLM Finetuning Toolkit Download - LLM Finetuning Toolkit Código Fonte Download

LLM Finetuning Toolkit

Outro código-fonte

v0.2.3

Baixar

LLM Finetuning Toolkit

Visão geral

O LLM Finetuning Toolkit é uma ferramenta de CLI baseada em configuração para lançar uma série de experimentos de ajuste fino da LLM em seus dados e reunir seus resultados. A partir de um único arquivo de configuração yaml , controle todos os elementos de um pipeline de experimentação típico - prompts , LLMs de código aberto , estratégia de otimização e teste de LLM .

Instalação

pipx (recomendado)

O PIPX instala o pacote e as dependências em um ambiente virtual separado

pipx install llm-toolkit

pip

pip install llm-toolkit

Início rápido

Este guia contém 3 estágios que permitirão que você aproveite ao máximo este kit de ferramentas!

Básico : Execute seu primeiro experimento de ajuste fino LLM
Intermediário : Execute um experimento personalizado alterando os componentes do arquivo de configuração da YAML
Avançado : Lançar séries de experimentos de ajuste fino em diferentes modelos de prompt, LLMS, técnicas de otimização-em todos os arquivos de configuração da YAML

Básico

llmtune generate config
llmtune run ./config.yml

O primeiro comando gera um arquivo útil inicial config.yml e salva no diretório de trabalho atual. Isso é fornecido aos usuários para começar rapidamente e como base para uma modificação adicional.

Em seguida, o segundo comando inicia o processo de ajuste fino usando as configurações especificadas no arquivo de configuração YAML padrão config.yaml .

Intermediário

O arquivo de configuração é a peça central que define o comportamento do kit de ferramentas. Está escrito no formato YAML e consiste em várias seções que controlam diferentes aspectos do processo, como ingestão de dados, definição de modelo, treinamento, inferência e garantia de qualidade. Destacamos algumas das seções críticas.

Flash Atenção 2

Para ativar a atendimento flash para modelos suportados. Primeiro instalar flash-attn :

pipx

pipx inject llm-toolkit flash-attn --pip-args=--no-build-isolation

pip

 pip install flash-attn --no-build-isolation

Em seguida, adicione ao arquivo de configuração.

 model :
  torch_dtype : " bfloat16 " # or "float16" if using older GPU
  attn_implementation : " flash_attention_2 "

Ingestão de dados

Um exemplo de como pode ser a ingestão de dados:

 data :
  file_type : " huggingface "
  path : " yahma/alpaca-cleaned "
  prompt :
    # ## Instruction: {instruction}
    # ## Input: {input}
    # ## Output:
  prompt_stub : { output }
  test_size : 0.1 # Proportion of test as % of total; if integer then # of samples
  train_size : 0.9 # Proportion of train as % of total; if integer then # of samples
  train_test_split_seed : 42

Enquanto o exemplo acima ilustra o uso de um conjunto de dados público do Hugging Face, o arquivo de configuração também pode ingerir seus próprios dados.

   file_type : " json "
   path : " <path to your data file>

   file_type : " csv "
   path : " <path to your data file>

Os campos prompts ajudam a criar instruções para ajustar o LLM. Ele lê dados de colunas específicas, mencionadas nos colchetes {}, que estão presentes no seu conjunto de dados. No exemplo fornecido, espera -se que o arquivo de dados tenha nomes de colunas: instruction , input e output .
Os campos prompts usam o prompt e prompt_stub durante o ajuste fino. No entanto, durante o teste, apenas a seção prompt é usada como entrada para o LLM ajustado.

Definição LLM

 model :
  hf_model_ckpt : " NousResearch/Llama-2-7b-hf "
  quantize : true
  bitsandbytes :
    load_in_4bit : true
    bnb_4bit_compute_dtype : " bf16 "
    bnb_4bit_quant_type : " nf4 "

# LoRA Params -------------------
lora :
  task_type : " CAUSAL_LM "
  r : 32
  lora_dropout : 0.1
  target_modules :
    - q_proj
    - v_proj
    - k_proj
    - o_proj
    - up_proj
    - down_proj
    - gate_proj

Embora o exemplo acima mostre o uso do LLAMA2 7B, em teoria, qualquer LLM de código aberto suportado por abraçar o rosto pode ser usado neste kit de ferramentas.

 hf_model_ckpt : " mistralai/Mistral-7B-v0.1 "

 hf_model_ckpt : " tiiuae/falcon-7b "

Os parâmetros para Lora, como a classificação r e o abandono, podem ser alterados.

 lora :
  r : 64
  lora_dropout : 0.25

Garantia de qualidade

 qa :
  llm_metrics :
    - length_test
    - word_overlap_test

Para garantir que o LLM de ajuste fino se comporte como esperado, você pode adicionar testes que verificam se o comportamento desejado está sendo alcançado. Exemplo: para um LLM fino ajustado para uma tarefa de resumo, podemos querer verificar se o resumo gerado é realmente menor em comprimento do que o texto de entrada. Também gostaríamos de aprender a sobreposição entre as palavras no texto original e o resumo gerado.

Saídas de artefatos

Esta configuração será executada e salvará os resultados no diretório ./experiment/[unique_hash] . Cada configuração exclusiva gerará um hash exclusivo, para que nossa ferramenta possa pegar automaticamente de onde parou. Por exemplo, se você precisar sair no meio do treinamento, relançando o script, o programa carregará automaticamente o conjunto de dados existente que foi gerado no diretório, em vez de fazê -lo novamente.

Depois que o script termina em execução, você verá estes artefatos distintos:

/dataset # generated pkl file in hf datasets format
/model # peft model weights in hf format
/results # csv of prompt, ground truth, and predicted values
/qa # csv of test results: e.g. vector similarity between ground truth and prediction

Depois que todas as alterações forem incorporadas no arquivo YAML, você pode simplesmente usá-lo para executar um experimento personalizado de ajuste fino!

python toolkit.py --config-path < path to custom YAML file >

Avançado

Os fluxos de trabalho de ajuste fino geralmente envolvem a execução de estudos de ablação em vários LLMs, projetos rápidos e técnicas de otimização. O arquivo de configuração pode ser alterado para apoiar os estudos de ablação.

Especifique modelos de prompt diferentes para experimentar o ajuste fino.

 data :
  file_type : " huggingface "
  path : " yahma/alpaca-cleaned "
  prompt :
    - >-
      This is the first prompt template to iterate over
      ### Input: {input}
      ### Output:
    - >-
      This is the second prompt template
      ### Instruction: {instruction}
      ### Input: {input}
      ### Output:
  prompt_stub : { output }
  test_size : 0.1 # Proportion of test as % of total; if integer then # of samples
  train_size : 0.9 # Proportion of train as % of total; if integer then # of samples
  train_test_split_seed : 42

Especifique vários LLMs com os quais você gostaria de experimentar.

 model :
  hf_model_ckpt :
    [
      " NousResearch/Llama-2-7b-hf " ,
      mistralai/Mistral-7B-v0.1",
      " tiiuae/falcon-7b " ,
    ]
  quantize : true
  bitsandbytes :
    load_in_4bit : true
    bnb_4bit_compute_dtype : " bf16 "
    bnb_4bit_quant_type : " nf4 "

Especifique diferentes configurações de Lora que você gostaria de ablatar.

 lora :
  r : [16, 32, 64]
  lora_dropout : [0.25, 0.50]

Estendendo -se

O kit de ferramentas fornece uma arquitetura modular e extensível que permite aos desenvolvedores personalizar e aprimorar sua funcionalidade para atender às suas necessidades específicas. Cada componente do kit de ferramentas, como ingestão de dados, ajuste fino, inferência e teste de garantia de qualidade, é projetado para ser facilmente extensível.

Contribuindo

As contribuições de código aberto para este kit de ferramentas são bem-vindas e incentivadas. Se você deseja contribuir, consulte contribuindo.md.

Expandir

Informações adicionais

Versão v0.2.3
Tipo Outro código-fonte
Data da Última Atualização 2025-04-16
tamanho 9.94MB
Vindo de Github

Aplicativos Relacionados

webextension pixiv toolkit

2024-11-12
TensorRT LLM

2024-11-10
jsdoc_toolkit v2.3.1

2022-05-31
jsdoc_toolkit v2.0.1 b

2022-05-30
kit de ferramentas jsdoc

2009-05-24
jsdoc_toolkit

2009-05-11

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos