LLM Pretrain SFT Download - LLM Pretrain SFT Código Fonte Download

LLM Pretrain SFT

Código-Fonte de IA

1.0.0

Baixar

LLM-Pretrain-Sft

Scripts de LLM Pré -Trerendo e Finiques (SFT)

Lora & DeepSpeed suportado

O repositório é baseado em Tatsu-Lab/Stanford_alpaca.

LLM suportado

Lhama 1 e 2
Baichuan 2
Mistral

Pré -atreto (pré -rano contínuo)

Antes de iniciar o LLM de pré-treinamento contínuo, você deve fornecer o nome do modelo (Huggingface) ou o caminho do modelo local.
Prepare os dados de treinamento, você pode usar o texto simples no formato de Markdown ou TXT para pré -treinamento. O exemplo é um guia para escrever a declaração de impacto dos neurips. Você pode adicionar mais corpus de texto na pasta de dados.
Lançar

 pip install -r requirements.txt
cd llm_pretrain
./pretrain_llama.sh

Observe que algumas configurações de parâmetros desses modelos são diferentes.

Sft

Antes de iniciar o Tuneing LLM, você deve fornecer o nome do modelo (Huggingface) ou o caminho do modelo local.
Prepare dados de treinamento, você pode adicionar seus próprios dados de tarefas como o exemplo em sft_examples.json, que é semelhante ao alpaca_data.json

O formato é o seguinte:

 {
    "binary_selection": [
    {
            "instruction": "Does the following text violate the law?nText: OH MY FUCKING GOD",
            "output": "No"
    },
    ...
    ],
    "another_task_name": [
    {
            "instruction": "How are you?",
            "output": "Not bad."
    },
    ...
    ],
    ...
}

Observe que, se você colocar o alpaca_data.json na pasta de dados, o script o usará como parte dos dados de treinamento.

LLAMA-2 : Como não há pad_token em llama-2, é recomendável que você possa adicionar 'tokenizer.pad_token = tokenizer.unk_token' ao tokenizer.

Lançar

Parâmetros completos

 pip install -r requirements.txt
cd llm_sft
./train_llama.sh

Lora

 pip install -r requirements.txt
cd llm_sft
./train_baichuan_LORA.sh

Você pode ajustar as configurações no trens_lora.py. Em nossos experimentos, para Baichuan, a versão dos Transformers deve> = 4.29.0 e <4,34.0.

Observe que algumas configurações de parâmetros desses modelos são diferentes.

DeepSpeed

Se você deseja usar o DeepSpeed, use o seguinte comando:

 --deepspeed "./configs/default_offload_opt_param.json"

Árvore de arquivo

 .
├── LICENSE
├── README.md
├── llm_pretrain_clean
│   ├── data
│   │   └── A_Guide_to_Writing_the_NeurIPS_Impact_Statement.md
│   ├── evaluation
│   │   └── inference_single.py
│   ├── generate_pretrain_data.py
│   ├── pretrain.py
│   ├── pretrain_baichuan2.sh
│   ├── pretrain_llama.sh
│   ├── pretrain_mistral.sh
│   ├── requirementsX.txt
│   └── utils.py
└── sft_model_clean
    ├── README.md
    ├── configs
    │   └── default_offload_opt_param.json
    ├── data
    │   ├── alpaca_data.json
    │   └── sft_examples.json
    ├── evaluation
    │   └── inference_single.py
    ├── generate_sft_data.py
    ├── requirementsX.txt
    ├── train.py
    ├── train_baichuan.sh
    ├── train_baichuan_LORA.sh
    ├── train_llama.sh
    ├── train_lora.py
    ├── train_mistral.sh
    └── utils.py

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-02
tamanho 6.84MB
Vindo de Github

Aplicativos Relacionados

TensorRT LLM

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos