Descarga de LLM Pretrain SFT - Descarga del código fuente de LLM Pretrain SFT

LLM Pretrain SFT

Código Fuente de IA

1.0.0

Descargar

Llm-pretrain-sft

Scripts de LLM Pretratening y Fineting (SFT)

Lora y Deepspeed apoyado

El repositorio se basa en Tatsu-Lab/Stanford_Alpaca.

Compatible LLM

Llama 1 y 2
Baichuan 2
Mistral

Pretrain (pretrionado continuo)

Antes de comenzar la LLM de pre-entrenamiento continuo, debe proporcionar el nombre del modelo (Huggingface) o la ruta del modelo local.
Prepare los datos de entrenamiento, puede usar texto plano en el formato de Markdown o TXT para el pretrete. El ejemplo es una guía para escribir la declaración de impacto de Neurips. Puede agregar más Corpus de texto en la carpeta de datos.
Lanzamiento

 pip install -r requirements.txt
cd llm_pretrain
./pretrain_llama.sh

Tenga en cuenta que algunas configuraciones de parámetros de estos modelos son diferentes.

Sft

Antes de comenzar a ajustar LLM, debe proporcionar el nombre del modelo (Huggingface) o la ruta del modelo local.
Prepare los datos de entrenamiento, puede agregar sus propios datos de tareas como el ejemplo en sft_examples.json, que es similar al alpaca_data.json

El formato es el siguiente:

 {
    "binary_selection": [
    {
            "instruction": "Does the following text violate the law?nText: OH MY FUCKING GOD",
            "output": "No"
    },
    ...
    ],
    "another_task_name": [
    {
            "instruction": "How are you?",
            "output": "Not bad."
    },
    ...
    ],
    ...
}

Tenga en cuenta que si coloca el alpaca_data.json en la carpeta de datos, el script lo usará como parte de los datos de entrenamiento.

LLAMA-2 : Dado que no hay pad_token en Llama-2, se recomienda que pueda agregar 'tokenizer.pad_token = tokenizer.unk_token' al tokenizer.

Lanzamiento

Parámetros completos

 pip install -r requirements.txt
cd llm_sft
./train_llama.sh

Lora

 pip install -r requirements.txt
cd llm_sft
./train_baichuan_LORA.sh

Puede ajustar las configuraciones en Train_lora.py. En nuestros experimentos, para Baichuan, su versión Transformers debería> = 4.29.0 y <4.34.0.

Tenga en cuenta que algunas configuraciones de parámetros de estos modelos son diferentes.

Velocidad profunda

Si desea usar DeepSpeed, use el siguiente comando:

 --deepspeed "./configs/default_offload_opt_param.json"

Árbol de archivos

 .
├── LICENSE
├── README.md
├── llm_pretrain_clean
│   ├── data
│   │   └── A_Guide_to_Writing_the_NeurIPS_Impact_Statement.md
│   ├── evaluation
│   │   └── inference_single.py
│   ├── generate_pretrain_data.py
│   ├── pretrain.py
│   ├── pretrain_baichuan2.sh
│   ├── pretrain_llama.sh
│   ├── pretrain_mistral.sh
│   ├── requirementsX.txt
│   └── utils.py
└── sft_model_clean
    ├── README.md
    ├── configs
    │   └── default_offload_opt_param.json
    ├── data
    │   ├── alpaca_data.json
    │   └── sft_examples.json
    ├── evaluation
    │   └── inference_single.py
    ├── generate_sft_data.py
    ├── requirementsX.txt
    ├── train.py
    ├── train_baichuan.sh
    ├── train_baichuan_LORA.sh
    ├── train_llama.sh
    ├── train_lora.py
    ├── train_mistral.sh
    └── utils.py

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-02
tamaño 6.84MB
Proviene de Github

Aplicaciones relacionadas

TensorRT LLM

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo