Descarga alpaca 7b chinese - Descargar el código fuente alpaca 7b chinese

alpaca 7b chinese

Código Fuente de IA

1.0.0

Descargar

???? Finetune Llama-7B con conjuntos de datos de instrucciones chinas

Para obtener más métodos de Finetune para LLM, consulte LLM-Finetune-Guide

¡Este repositorio es un tutorial para Finetuning Llama-7B con conjuntos de datos chinos! Encuesto y combino el conjunto de datos y el método para Finetuning My Own LLM para tareas complejas de PNL, como resumen, respuesta a preguntas, generación de texto, aumento de datos personalizados, etc.

Dado que el Stanford Alpaca-7b Finetune original necesita muchos recursos de GPU, me concentro en inspeccionar el método con un bajo consumo de GPU.

Así que aquí está cómo reproducir:

Instalación

Requisitos de instalación

$ pip install -r requirements.txt

Instale Pytorch en la versión compatible con CUDA

$ pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1+cu116 --extra-index-url https://download.pytorch.org/whl/cu116

Conjuntos de datos

Este repositorio combinó todos los conjuntos de datos utilizando la construcción de instrucción inglesa, construcción de salida china:

alpaca_data.json : conjunto de datos original de Stanford Alpaca
alpaca_data_cleansed.json : limpieza por gururise/alpacadatacleaned
alpaca-zhCN.json : traducir por carbonz0/alpaca-chineset-dataset
alpaca-zhTW.json : traducir al chino tradicional usando OpenCC
alpaca-en-zh.json : Combine la instrucción/entrada en inglés y la producción china por Ntunlplab/tradicional-china-alpaca: (tradicional tradicional chino traducido por chatgpt api ( gpt-3.5-turbo ) por ntunlplab/tradicional-chines-alpaca (actualización a 2023.03.29))))))))

Afinar

Método Finetune de referencia proporcionado por Tloen/Alpaca-Lora

Ejecute en 1 GPU con Colab: https://colab.research.google.com/drive/1qvtrjpikkknksbwwg766sigbbw2tqrd5?usp=sharing

LLaMA

$ cd finetune/
$ python finetune.py --base_model decapoda-research/llama-7b-hf --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/llama-7b-hf_alpaca-en-zh --lora_target_modules ' ["q_proj", "v_proj"] '

BLOOM

$ cd finetune/
$ python finetune.py --base_model bigscience/bloomz-7b1-mt --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/bloomz-7b1-mt_alpaca-en-zh --lora_target_modules ' ["query_key_value"] '

Use torchrun para capacitación distribuida en multi-GPUS

LLaMA

$ cd finetune/
$ torchrun --standalone --nnodes=1 --nproc_per_node=4 finetune.py --base_model decapoda-research/llama-7b-hf --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/llama-7b-hf_alpaca-en-zh --lora_target_modules ' ["q_proj", "v_proj"] '

BLOOM

$ cd finetune/
$ torchrun --standalone --nnodes=1 --nproc_per_node=4 finetune.py --base_model bigscience/bloomz-7b1-mt --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/bloomz-7b1-mt_alpaca-en-zh --lora_target_modules ' ["query_key_value"] '

Tareas de dominio Finetune

He recopilado diferentes tareas de dominio en mi repositorio: instrucciones-finetune-datasets

¡Bienvenidas cooperaciones! Póngase en contacto conmigo en: [email protected] . Me gustaría probar tareas de diferentes dominios, como inversión, fraude, comercio electrónico, ley, atención médica, ...

Modelo

¡Para servir su propio servicio modelo a través de API y UI del sitio web simple!

API modelo
```
$ cd serve/
$ python api.py
```
demostración ui
```
$ cd serve/
$ python ui.py
```

Obtenga más información

Arreglé los métodos Finetune para LLM en LLM-Finetune-Guide

Curraté muchos métodos que intentan ejecutar modelos de idiomas grandes con menos recursos de GPU:

Peft
Lora
Flexgen ...

Ver lista completa: chatgpt-alternativa

 @misc{alpaca-7b-chinese,
  author = {JiunYi Yang},
  title = {Alpaca-7B Chinese: Finetune LLaMA-7B with Chinese instruction datasets},
  year = {2023},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {url{https://github.com/A-baoYang/alpaca-7b-chinese}},
}

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-03
tamaño 18.02MB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Versión oficial del código fuente del proyecto de juegos chinos de DOS (juegos chinos de DOS en el navegador)

2022-11-01
Pelota de Alpaca: Allstars

2022-08-08

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo