alpaca 7b chinese Téléchargement - alpaca 7b chinese Code source Téléchargement

alpaca 7b chinese

Code Source AI

1.0.0

Télécharger

???? Finetune Llama-7b avec des ensembles de données d'instructions chinoises

Pour plus de méthodes Finetune pour LLM, veuillez consulter LLM-Finetune-Guide

Ce référentiel est un tutoriel pour Finetuning Llama-7b avec des ensembles de données chinoises! J'enquête et combine l'ensemble de données et la méthode pour la fin de mon propre LLM pour des tâches NLP complexes telles que le résumé, la réponse aux questions, la génération de texte, l'augmentation des données personnalisées, etc.

Étant donné que le Finetune d'origine Stanford Alpaca-7B a besoin de beaucoup de ressources GPU, je me concentre sur l'arpentage de la méthode avec une faible consommation de GPU.

Alors voici comment se reproduire:

Installation

Installer les exigences

$ pip install -r requirements.txt

Installez Pytorch à la version compatible avec CUDA

$ pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1+cu116 --extra-index-url https://download.pytorch.org/whl/cu116

Ensembles de données

Ce référentiel a combiné tous les ensembles de données à l'aide de l'instruction anglaise et de la construction de sorties chinoises:

alpaca_data.json : ensemble de données original de Stanford Alpaca
alpaca_data_cleansed.json : nettoyage par gururise / alpacadatacleaned
alpaca-zhCN.json : traduire par carbonz0 / alpaca-chinois-dataset
alpaca-zhTW.json : traduire en chinois traditionnel à l'aide OpenCC
alpaca-en-zh.json : combinez l'instruction / entrée en anglais et la sortie chinoise par ntunlplab / traditionnel-chinois-alpaca: (ensemble de données chinois traditionnel traduit par l'API Chatgpt ( gpt-3.5-turbo ) par ntunlplab / traditionnel-chinese-alpaca (mise à jour au 2023.03.29)))

Affiner

Référence FineTune méthode fournie par Tloen / Alpaca-lora

Exécutez sur 1 GPU avec Colab: https://colab.research.google.com/drive/1qvtrjpikkknksbwwg766sigbbw2tqrd5?usp=sharing

LLaMA

$ cd finetune/
$ python finetune.py --base_model decapoda-research/llama-7b-hf --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/llama-7b-hf_alpaca-en-zh --lora_target_modules ' ["q_proj", "v_proj"] '

BLOOM

$ cd finetune/
$ python finetune.py --base_model bigscience/bloomz-7b1-mt --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/bloomz-7b1-mt_alpaca-en-zh --lora_target_modules ' ["query_key_value"] '

Utilisez torchrun pour une formation distribuée sur le multi-GPUS

LLaMA

$ cd finetune/
$ torchrun --standalone --nnodes=1 --nproc_per_node=4 finetune.py --base_model decapoda-research/llama-7b-hf --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/llama-7b-hf_alpaca-en-zh --lora_target_modules ' ["q_proj", "v_proj"] '

BLOOM

$ cd finetune/
$ torchrun --standalone --nnodes=1 --nproc_per_node=4 finetune.py --base_model bigscience/bloomz-7b1-mt --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/bloomz-7b1-mt_alpaca-en-zh --lora_target_modules ' ["query_key_value"] '

Tâches du domaine Finetune

J'ai collecté différentes tâches de domaine dans mon référentiel: Instruction-Finetune-Datasets

Cooperations de bienvenue! Veuillez me contacter à: [email protected] . J'aimerais essayer des tâches de différents domaines tels que l'investissement, la fraude, le commerce électronique, le droit, les soins de santé, ...

Modèle de service

Pour servir votre propre service de modèle via l'API et l'interface utilisateur de site Web simple!

API modèle
```
$ cd serve/
$ python api.py
```
Démo Ui
```
$ cd serve/
$ python ui.py
```

Apprendre encore plus

J'ai organisé des méthodes Finetune pour LLM à LLM-Finetune-Guide

J'ai organisé beaucoup de méthode qui essaie d'exécuter de grands modèles de langage avec moins de ressources GPU:

Pivot
Lora
Flexgen ...

Voir Liste complète: ChatGpt-Alternatives

 @misc{alpaca-7b-chinese,
  author = {JiunYi Yang},
  title = {Alpaca-7B Chinese: Finetune LLaMA-7B with Chinese instruction datasets},
  year = {2023},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {url{https://github.com/A-baoYang/alpaca-7b-chinese}},
}

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-03
taille 18.02MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Version officielle du code source du projet de jeux DOS chinois (jeux DOS chinois dans le navigateur)

2022-11-01
Balle d'alpaga : Allstars

2022-08-08

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout