LLM Pretrain SFT Download - LLM Pretrain SFT Sumber Code Unduh

LLM Pretrain SFT

Kode Sumber AI

1.0.0

Unduh

Llm-pretrain-sft

Skrip LLM Pretraining and Finetuing (SFT)

Lora & Deepspeed didukung

Repositori didasarkan pada Tatsu-Lab/Stanford_alpaca.

LLM yang didukung

Llama 1 & 2
Baichuan 2
Mistral

Pretrain (pretrain terus -menerus)

Sebelum Anda memulai LLM pra-pelatihan terus menerus, Anda harus memberikan nama model (HuggingFace) atau jalur model lokal.
Siapkan data pelatihan, Anda dapat menggunakan teks biasa dalam format Markdown atau TXT untuk pretraining. Contohnya adalah panduan untuk menulis Pernyataan Dampak Neurips. Anda dapat menambahkan lebih banyak corpus teks di folder data.
Meluncurkan

 pip install -r requirements.txt
cd llm_pretrain
./pretrain_llama.sh

Perhatikan bahwa beberapa pengaturan parameter dari model ini berbeda.

Sft

Sebelum Anda mulai menyempurnakan LLM, Anda harus memberikan nama model (HuggingFace) atau jalur model lokal.
Siapkan data pelatihan, Anda dapat menambahkan data tugas Anda sendiri seperti contoh di sft_examples.json, yang mirip dengan alpaca_data.json

Formatnya adalah sebagai berikut:

 {
    "binary_selection": [
    {
            "instruction": "Does the following text violate the law?nText: OH MY FUCKING GOD",
            "output": "No"
    },
    ...
    ],
    "another_task_name": [
    {
            "instruction": "How are you?",
            "output": "Not bad."
    },
    ...
    ],
    ...
}

Perhatikan bahwa jika Anda memasukkan alpaca_data.json di folder data, skrip akan menggunakannya sebagai bagian dari data pelatihan.

Llama-2 : Karena tidak ada pad_token di llama-2, disarankan agar Anda dapat menambahkan 'tokenizer.pad_token = tokenizer.unk_token' ke tokenizer.

Meluncurkan

Parameter penuh

 pip install -r requirements.txt
cd llm_sft
./train_llama.sh

Lora

 pip install -r requirements.txt
cd llm_sft
./train_baichuan_LORA.sh

Anda dapat menyesuaikan konfigurasi di train_lora.py. Dalam percobaan kami, untuk Baichuan, versi Transformers Anda harus> = 4.29.0 dan <4.34.0.

Perhatikan bahwa beberapa pengaturan parameter dari model ini berbeda.

Kecepatan yang dalam

Jika Anda ingin menggunakan Deepspeed, gunakan perintah berikut:

 --deepspeed "./configs/default_offload_opt_param.json"

Pohon file

 .
├── LICENSE
├── README.md
├── llm_pretrain_clean
│   ├── data
│   │   └── A_Guide_to_Writing_the_NeurIPS_Impact_Statement.md
│   ├── evaluation
│   │   └── inference_single.py
│   ├── generate_pretrain_data.py
│   ├── pretrain.py
│   ├── pretrain_baichuan2.sh
│   ├── pretrain_llama.sh
│   ├── pretrain_mistral.sh
│   ├── requirementsX.txt
│   └── utils.py
└── sft_model_clean
    ├── README.md
    ├── configs
    │   └── default_offload_opt_param.json
    ├── data
    │   ├── alpaca_data.json
    │   └── sft_examples.json
    ├── evaluation
    │   └── inference_single.py
    ├── generate_sft_data.py
    ├── requirementsX.txt
    ├── train.py
    ├── train_baichuan.sh
    ├── train_baichuan_LORA.sh
    ├── train_llama.sh
    ├── train_lora.py
    ├── train_mistral.sh
    └── utils.py

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-02
ukuran 6.84MB
Berasal dari Github

Aplikasi Terkait

TensorRT LLM

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua