LLM Pretrain SFT下載LLM Pretrain SFT源代碼下載

LLM Pretrain SFT

Ai源碼

1.0.0

下載

LLM-PROTRAIN-SFT

LLM預處理和修訂的腳本（SFT）

洛拉和深速支持

存儲庫基於tatsu-lab/stanford_alpaca。

支持的LLM

美洲駝1和2
Baichuan 2
Mistral

預處理（持續預處理）

在開始連續培訓LLM之前，您應該提供模型名稱（擁抱面）或本地模型路徑。
準備培訓數據，您可以使用Markdown或TXT格式的純文本進行預處理。該示例是編寫神經影響聲明的指南。您可以在數據文件夾中添加更多文本語料庫。
發射

 pip install -r requirements.txt
cd llm_pretrain
./pretrain_llama.sh

請注意，這些模型的某些參數設置不同。

SFT

在開始微調LLM之前，您應該提供模型名稱（擁抱面）或本地模型路徑。
準備培訓數據，您可以添加自己的任務數據，例如sft_examples.json中的示例，該示例類似於alpaca_data.json

格式如下：

 {
    "binary_selection": [
    {
            "instruction": "Does the following text violate the law?nText: OH MY FUCKING GOD",
            "output": "No"
    },
    ...
    ],
    "another_task_name": [
    {
            "instruction": "How are you?",
            "output": "Not bad."
    },
    ...
    ],
    ...
}

請注意，如果將Alpaca_data.json放在數據文件夾中，則腳本將其用作培訓數據的一部分。

Llama-2 ：由於Llama-2中沒有PAD_TOKEN，因此建議您可以添加'tokenizer.pad_token = tokenizer.ink_token'到Tokenizer。

發射

完整參數

 pip install -r requirements.txt
cd llm_sft
./train_llama.sh

洛拉

 pip install -r requirements.txt
cd llm_sft
./train_baichuan_LORA.sh

您可以調整train_lora.py中的配置。在我們的實驗中，對於Baichuan，您的變形金剛版本應> = 4.29.0和<4.34.0。

請注意，這些模型的某些參數設置不同。

深速

如果要使用DeepSpeed，請使用以下命令：

 --deepspeed "./configs/default_offload_opt_param.json"

文件樹

 .
├── LICENSE
├── README.md
├── llm_pretrain_clean
│   ├── data
│   │   └── A_Guide_to_Writing_the_NeurIPS_Impact_Statement.md
│   ├── evaluation
│   │   └── inference_single.py
│   ├── generate_pretrain_data.py
│   ├── pretrain.py
│   ├── pretrain_baichuan2.sh
│   ├── pretrain_llama.sh
│   ├── pretrain_mistral.sh
│   ├── requirementsX.txt
│   └── utils.py
└── sft_model_clean
    ├── README.md
    ├── configs
    │   └── default_offload_opt_param.json
    ├── data
    │   ├── alpaca_data.json
    │   └── sft_examples.json
    ├── evaluation
    │   └── inference_single.py
    ├── generate_sft_data.py
    ├── requirementsX.txt
    ├── train.py
    ├── train_baichuan.sh
    ├── train_baichuan_LORA.sh
    ├── train_llama.sh
    ├── train_lora.py
    ├── train_mistral.sh
    └── utils.py

展開

附加信息

版本 1.0.0
類型 Ai源碼
更新時間 2025-09-02
大小 6.84MB
來自於 Github

相關應用

TensorRT LLM

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
ML stack

Ai源碼

1.0.0
awesome free chatgpt

Ai源碼

1.0.0
pywin_contextmenu

Ai源碼

Version update
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部