Unduh alpaca 7b chinese - alpaca 7b chinese

alpaca 7b chinese

Kode Sumber AI

1.0.0

Unduh

???? Finetune llama-7b dengan set data instruksi Cina

Untuk lebih banyak metode finetune untuk LLM, silakan lihat LLM-Finetune-Guide

Repositori ini adalah tutorial untuk Finetuning Llama-7b dengan set data Cina! Saya mensurvei dan menggabungkan dataset & metode untuk finetuning LLM saya sendiri untuk tugas -tugas NLP yang kompleks seperti ringkasan, penjawab pertanyaan, pembuatan teks, augmentasi data khusus, dll.

Karena Finetune Stanford Alpaca-7b asli membutuhkan banyak sumber daya GPU, saya fokus pada survei metode dengan konsumsi GPU yang rendah.

Jadi inilah cara mereproduksi:

Instalasi

Pasang persyaratan

$ pip install -r requirements.txt

Instal Pytorch pada versi yang kompatibel dengan CUDA

$ pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1+cu116 --extra-index-url https://download.pytorch.org/whl/cu116

Kumpulan data

Repositori ini menggabungkan semua dataset menggunakan konstruksi bahasa Inggris, konstruksi output Cina:

alpaca_data.json : Dataset asli dari Stanford Alpaca
alpaca_data_cleansed.json : pembersihan dengan gururise/alpacadatacleaned
alpaca-zhCN.json : diterjemahkan oleh carbonz0/alpaca-chinese-dataset
alpaca-zhTW.json : Terjemahkan ke Cina Tradisional Menggunakan OpenCC
alpaca-en-zh.json : Gabungkan instruksi/input bahasa Inggris dan output Cina oleh ntunlplab/tradisional-Cina-Alpaca: (Dataset Tradisional Cina diterjemahkan oleh chatgpt API ( gpt-3.5-turbo ) oleh Ntunlplab/Tradisional-Chinese-Alpaca (perbarui pada 2023.03.29)

Finetune

Metode Referensi Finetune disediakan oleh tloen/alpaca-lora

Jalankan 1 GPU dengan colab: https://colab.research.google.com/drive/1qvtrjpikkknksbwg766sigbbw2tqrd5?usp=sharing

LLaMA

$ cd finetune/
$ python finetune.py --base_model decapoda-research/llama-7b-hf --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/llama-7b-hf_alpaca-en-zh --lora_target_modules ' ["q_proj", "v_proj"] '

BLOOM

$ cd finetune/
$ python finetune.py --base_model bigscience/bloomz-7b1-mt --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/bloomz-7b1-mt_alpaca-en-zh --lora_target_modules ' ["query_key_value"] '

Gunakan torchrun untuk Pelatihan Terdistribusi pada Multi-GPU

LLaMA

$ cd finetune/
$ torchrun --standalone --nnodes=1 --nproc_per_node=4 finetune.py --base_model decapoda-research/llama-7b-hf --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/llama-7b-hf_alpaca-en-zh --lora_target_modules ' ["q_proj", "v_proj"] '

BLOOM

$ cd finetune/
$ torchrun --standalone --nnodes=1 --nproc_per_node=4 finetune.py --base_model bigscience/bloomz-7b1-mt --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/bloomz-7b1-mt_alpaca-en-zh --lora_target_modules ' ["query_key_value"] '

Tugas domain finetune

Saya telah mengumpulkan tugas domain yang berbeda di repositori saya: Instruksi-Finetune-Datasets

Selamat datang bersama! Silakan hubungi saya di: [email protected] . Saya ingin mencoba tugas dari berbagai domain seperti investasi, penipuan, e-commerce, hukum, perawatan kesehatan, ...

Model porsi

Untuk melayani layanan model Anda sendiri melalui API & Situs Web Sederhana UI!

API Model
```
$ cd serve/
$ python api.py
```
demo ui
```
$ cd serve/
$ python ui.py
```

Pelajari lebih lanjut

Saya mengatur metode finetune untuk llm di llm-finetune-guide

Saya mengkuratori banyak metode yang mencoba menjalankan model bahasa besar dengan sumber daya GPU yang lebih sedikit:

Peft
Lora
Flexgen ...

Lihat Daftar Lengkap: Chatgpt-Alternatif

 @misc{alpaca-7b-chinese,
  author = {JiunYi Yang},
  title = {Alpaca-7B Chinese: Finetune LLaMA-7B with Chinese instruction datasets},
  year = {2023},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {url{https://github.com/A-baoYang/alpaca-7b-chinese}},
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-03
ukuran 18.02MB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Game DOS Cina (game DOS Cina di browser) memproyeksikan kode sumber versi resmi

2022-11-01
Bola Alpaka: Allstars

2022-08-08

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua