alpaca 7b chinese - alpaca 7b chinese

alpaca 7b chinese

Código-Fonte de IA

1.0.0

Baixar

???? Finetune llama-7b com conjuntos de dados de instruções chinesas

Para métodos mais FineTune para LLM, consulte LLM-FineTune-Guide

Este repositório é um tutorial para o Finetuning LLAMA-7B com conjuntos de dados chineses! Pesquiso e combino o conjunto de dados e o método para o Finetuning meu próprio LLM para tarefas complexas de PNL, como resumo, resposta a perguntas, geração de texto, aumento de dados personalizados, etc.

Como o Stanford Alpaca-7b original precisa de muitos recursos da GPU, concentro-me em pesquisar o método com baixo consumo de GPU.

Então, aqui está como reproduzir:

Instalação

Instale requisitos

$ pip install -r requirements.txt

Instale Pytorch na versão compatível com CUDA

$ pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1+cu116 --extra-index-url https://download.pytorch.org/whl/cu116

Conjuntos de dados

Este repositório combinou todos os conjuntos de dados usando a instrução inglesa, construção chinesa-output:

alpaca_data.json : conjunto de dados original de Stanford Alpaca
alpaca_data_cleansed.json : limpeza por gururise/alpacadatacleaned
alpaca-zhCN.json : traduzido por carbonz0/alpaca-chinese-dados
alpaca-zhTW.json : traduza para chinês tradicional usando OpenCC
alpaca-en-zh.json : Combine a instrução/entrada em inglês e a saída chinesa por ntunlplab/tradicional-chinese-alpaca: (o conjunto de dados chinês tradicional traduzido por API ChatGPT ( gpt-3.5-turbo ) por NTunlPlab/tradicional-Chinese-alpaca (atualização em 2023.03.29)

Afinar

Método Finetune de referência fornecido por tloen/alpaca-lora

Execute 1 GPU com colab: https://colab.research.google.com/drive/1qvtrjpikkkkkksbwwg766sigbbw2tqrd5?usp=sharing

LLaMA

$ cd finetune/
$ python finetune.py --base_model decapoda-research/llama-7b-hf --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/llama-7b-hf_alpaca-en-zh --lora_target_modules ' ["q_proj", "v_proj"] '

BLOOM

$ cd finetune/
$ python finetune.py --base_model bigscience/bloomz-7b1-mt --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/bloomz-7b1-mt_alpaca-en-zh --lora_target_modules ' ["query_key_value"] '

Use torchrun para treinamento distribuído em multi-GPUs

LLaMA

$ cd finetune/
$ torchrun --standalone --nnodes=1 --nproc_per_node=4 finetune.py --base_model decapoda-research/llama-7b-hf --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/llama-7b-hf_alpaca-en-zh --lora_target_modules ' ["q_proj", "v_proj"] '

BLOOM

$ cd finetune/
$ torchrun --standalone --nnodes=1 --nproc_per_node=4 finetune.py --base_model bigscience/bloomz-7b1-mt --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/bloomz-7b1-mt_alpaca-en-zh --lora_target_modules ' ["query_key_value"] '

Tarefas de domínio FineTune

Eu colecionei diferentes tarefas de domínio no meu repositório: Instrução-Finetune-Datasets

Bem -vindo Cooperations! Entre em contato comigo em: [email protected] . Eu gostaria de experimentar tarefas de diferentes domínios, como investimento, fraude, comércio eletrônico, direito, assistência médica, ...

Modelo Serviço

Para servir seu próprio serviço de modelo por meio da API e UI simples do site!

Modelo API
```
$ cd serve/
$ python api.py
```
Demo ui
```
$ cd serve/
$ python ui.py
```

Saber mais

Eu organizei métodos Finetune para LLM em LLM-FineTune-Guide

Eu selecionei muito método que tenta executar grandes modelos de linguagem com menos recursos da GPU:

Peft
Lora
Flexgen ...

Veja a lista completa: ChatGPT-Alternatives

 @misc{alpaca-7b-chinese,
  author = {JiunYi Yang},
  title = {Alpaca-7B Chinese: Finetune LLaMA-7B with Chinese instruction datasets},
  year = {2023},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {url{https://github.com/A-baoYang/alpaca-7b-chinese}},
}

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-03
tamanho 18.02MB
Vindo de Github

Aplicativos Relacionados

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Jogos DOS chineses (jogos DOS chineses no navegador) versão oficial do código-fonte do projeto

2022-11-01
Bola Alpaca: Allstars

2022-08-08

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos