baichuan Qlora Tuning Download - baichuan Qlora Tuning Código fonte download

baichuan Qlora Tuning

Código-Fonte de IA

1.0.0

Baixar

Tuneamento de Baichuan-Qlora

Com base em Qlora, as instruções são ajustadas para o modelo Big Big Baichuan-7b.

confiar

 mpi4py
transformers == 4.28 . 1
peft == 0.3 . 0
icetk
deepspeed == 0.9 . 2
accelerate
cpm_kernels
sentencepiece == 0.1 . 99
peft = 0.3 . 0
torch = 2.0 . 0

A versão mais recente está ok.

Estrutura de diretório

 --data
----msra
------train.txt
------eval.txt
--checkpoint
----baichuan
------adapter_model
--model_hub
----baichuan-7B
--baichuan_qlora.py  # 训练
--dataset.py  # 处理数据
--predict.py  # 交互式闲聊
--test_baichuan.py  # 测试baichuan模型
--train.log  # 训练日志

Etapas gerais

Formato de dados

Os formatos de dados em Train.txt e Eval.txt são os mesmos, e cada comportamento é uma amostra, que é especificamente:

{ "instruct" : "你现在是一个实体识别模型，你需要提取文本里面的人名、地名、机构名，如果存在结果，返回'实体_实体类型'，不同实体间用n分隔。如果没有结果，回答'没有'。" , "query" : "文本：因有关日寇在京掠夺文物详情，藏界较为重视，也是我们收藏北京史料中的要件之一。" , "answer" : "日_地名n京_地名n北京_地名" }

Instruct é a instrução, a consulta é o texto e a resposta é o resultado. Pode ser construído por si só com base em seus próprios dados.

Os nomes dessas três colunas podem ser definidos em baichuan_qlora.py.

trem

Vá para o rosto abraçado para baixar os arquivos relevantes de Baichuan-7b para Model_Hub/Baichuan-7b. Após a conclusão do download, você pode usar python test_baichuan.pt para testar o modelo. Depois de construir o conjunto de dados, execute -o diretamente:

 python baichaun_qlora . py

prever

Após a conclusão do treinamento, você pode usar as seguintes instruções para fazer previsões:

 python predict . py - - model_name "baichuan" - - base_model "./model_hub/baichuan-7B" - - tokenizer_path "./model_hub/baichuan-7B" - - lora_model "./checkpoint/baichuan/adapter_model" - - with_prompt - - interactive

Resultados de previsão:

加载模型耗时： 0.6068947672843933分钟
loading peft model
Start inference with instruction mode .
== == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == =
+ 当前使用的模型是： baichuan
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
+ 该模式下仅支持单轮问答，无多轮对话能力。
== == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == =
Input :你现在是一个实体识别模型，你需要提取文本里面的人名、地名、机构名，如果存在结果，返回'实体_实体类型' ，不同实体间用n分隔。如果没有结果，回答'没有' 。文本：我们是受到郑振铎先生、阿英先生著作的启示，从个人条件出发，瞄准现代出版史研究的空白，重点集藏解放区、国民党毁禁出版物。
Response :  郑振铎_人名
阿英_人名


Input :你现在是一个实体识别模型，你需要提取文本里面的人名、地名、机构名，如果存在结果，返回'实体_实体类型' ，不同实体间用n分隔。如果没有结果，回答'没有' 。文本：藏书家、作家姜德明先生在1997年出版的书话专集《文林枝叶》中以“爱书的朋友”为题，详细介绍了我们夫妇的藏品及三口之家以书为友、好乐清贫的逸闻趣事。
Response :  姜德明_人名


Input :你现在是一个实体识别模型，你需要提取文本里面的人名、地名、机构名，如果存在结果，返回'实体_实体类型' ，不同实体间用n分隔。如果没有结果，回答'没有' 。文本：去年，我们又被评为“北京市首届家庭藏书状元明星户”。
Response :  北京_地名

Tem certos efeitos, mas não é muito bom. Pode exigir ajuste de parâmetros e treinamento por mais tempo.

Memória de vídeo prevista:

Reabastecer

** Como treinar seus próprios dados? ** Basta criar o formato necessário para os dados acima e, em seguida, modificar o endereço dos dados em Baichuan_qlora e, é claro, você também pode modificar alguns outros parâmetros.
Como usar outros modelos? A diferença entre outros modelos está em dois aspectos: 1. O formato de entrada dos dados é diferente. 2. O método de carregamento do modelo é diferente. Para Chatglm, Llama, Belle, você pode se referir ao que fez antes: https://github.com/taishan1994/qlora-chinese-llm

consulte

https://github.com/wp931120/baichuan_sft_lora
https://github.com/baichuan-inc/baichuan-7b
https://github.com/artidoro/qlora/
https://github.com/taishan1994/qlora-chinese-llm

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-11
tamanho 18.16MB
Vindo de Github

Aplicativos Relacionados

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos