LLM Pretrain SFT Download - LLM Pretrain SFT Source Code Download

LLM Pretrain SFT

Code Source AI

1.0.0

Télécharger

LLM-prétraitement-sft

Scripts de pré-formation et de fineting de LLM (SFT)

Lora & Deeppeed soutenue

Le référentiel est basé sur Tatsu-lab / stanford_alpaca.

LLM pris en charge

Lama 1 et 2
Baichuan 2
Mistral

Pretrain (prétraitement continu)

Avant de démarrer LLM pré-entraînement continu, vous devez fournir le nom du modèle (Huggingface) ou le chemin du modèle local.
Préparez les données de formation, vous pouvez utiliser du texte brut dans le format de Markdown ou TXT pour la pré-formation. L'exemple est un guide pour rédiger l'énoncé d'impact des Neirips. Vous pouvez ajouter plus de corpus de texte dans le dossier de données.
Lancement

 pip install -r requirements.txt
cd llm_pretrain
./pretrain_llama.sh

Notez que certains paramètres de paramètres de ces modèles sont différents.

SFT

Avant de commencer à régler Fining LLM, vous devez fournir le nom du modèle (Huggingface) ou le chemin du modèle local.
Préparez les données de formation, vous pouvez ajouter vos propres données de tâche comme l'exemple de sft_examples.json, qui est similaire à l'alpaca_data.json

Le format est le suivant:

 {
    "binary_selection": [
    {
            "instruction": "Does the following text violate the law?nText: OH MY FUCKING GOD",
            "output": "No"
    },
    ...
    ],
    "another_task_name": [
    {
            "instruction": "How are you?",
            "output": "Not bad."
    },
    ...
    ],
    ...
}

Notez que si vous mettez l'ALPACA_DATA.json dans le dossier de données, le script l'utilisera dans le cadre des données de formation.

Lama-2 : Puisqu'il n'y a pas de pad_token dans lama-2, il est recommandé de pouvoir ajouter 'tokenizer.pad_token = tokenizer.unk_token' au tokenizer.

Lancement

Paramètres complets

 pip install -r requirements.txt
cd llm_sft
./train_llama.sh

Lora

 pip install -r requirements.txt
cd llm_sft
./train_baichuan_LORA.sh

Vous pouvez ajuster les configurations dans le train_lora.py. Dans nos expériences, pour Baichuan, votre version Transformers devrait> = 4,29,0 et <4,34,0.

Notez que certains paramètres de paramètres de ces modèles sont différents.

Vitesse profonde

Si vous souhaitez utiliser DeepPeed, utilisez la commande suivante:

 --deepspeed "./configs/default_offload_opt_param.json"

Arbre de fichier

 .
├── LICENSE
├── README.md
├── llm_pretrain_clean
│   ├── data
│   │   └── A_Guide_to_Writing_the_NeurIPS_Impact_Statement.md
│   ├── evaluation
│   │   └── inference_single.py
│   ├── generate_pretrain_data.py
│   ├── pretrain.py
│   ├── pretrain_baichuan2.sh
│   ├── pretrain_llama.sh
│   ├── pretrain_mistral.sh
│   ├── requirementsX.txt
│   └── utils.py
└── sft_model_clean
    ├── README.md
    ├── configs
    │   └── default_offload_opt_param.json
    ├── data
    │   ├── alpaca_data.json
    │   └── sft_examples.json
    ├── evaluation
    │   └── inference_single.py
    ├── generate_sft_data.py
    ├── requirementsX.txt
    ├── train.py
    ├── train_baichuan.sh
    ├── train_baichuan_LORA.sh
    ├── train_llama.sh
    ├── train_lora.py
    ├── train_mistral.sh
    └── utils.py

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-02
taille 6.84MB
Provenant de Github

Applications connexes

TensorRT LLM

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout