download de self llm - download de código fonte self llm

self llm

Código-Fonte de IA

1.0.0

Baixar

Guia comestível de maquete de código aberto

Este projeto é um tutorial sobre modelos de bebês chineses exclusivos para modelos de código aberto, para iniciantes domésticos e baseados em plataformas Linux. Ele fornece orientações de processo completo para vários modelos de código aberto, incluindo configuração ambiental, implantação local, ajuste fino eficiente e outras habilidades, simplificando a implantação, uso e processo de aplicação de modelos de código aberto, permitindo que mais estudantes e pesquisadores comuns usem melhor modelos de código aberto, ajudando os modelos de código aberto e gratuitos a integrar a vida dos alunos comuns.

O principal conteúdo deste projeto inclui:

Um guia de configuração de ambiente LLM de código aberto LLM com base na plataforma Linux, fornecendo diferentes etapas detalhadas de configuração de ambiente para diferentes requisitos de modelo;
Tutoriais para a implantação e uso do mainstream Open Source LLM em casa e no exterior, incluindo lhama, chatglm, internlm, etc.;
Orientação de aplicação administrativa para o Open Source LLM, incluindo chamadas de linha de comando, implantação de demonstração on -line, integração da estrutura de Langchain, etc.
Métodos de ajuste fino e eficiente em grande escala do LLM de código aberto, incluindo ajuste fino em escala real distribuída, Lora, ptuning, etc.

O principal conteúdo do projeto são os tutoriais, para que mais estudantes e futuros profissionais possam entender e se familiarizar com os métodos de comer grandes modelos de código aberto! Qualquer pessoa pode propor um problema ou enviar um PR para construir e manter em conjunto esse projeto.

Os alunos que desejam participar profundamente podem entrar em contato conosco e o adicionaremos ao mantenedor do projeto.

Sugestões de aprendizado: as sugestões de aprendizado para este projeto são primeiro aprender a configuração do ambiente, depois aprender a implantação e uso do modelo e, finalmente, aprender o ajuste fino. Como a configuração do ambiente é a base, a implantação e o uso do modelo são a base e o ajuste fino é avançado. Os iniciantes podem escolher QWEN1.5, InternLM2, Minicpm e outros modelos para priorizar o aprendizado.

NOTA: Se os alunos quiserem entender a composição do modelo do grande modelo e escrever tarefas como RAG, agente e avaliar do zero, poderão aprender outro projeto de Datawhale. O Big Model é um tópico quente no campo do aprendizado profundo atualmente, mas a maioria dos grandes tutoriais de modelos existentes é apenas para ensiná -lo a chamar APIs para concluir a aplicação de grandes modelos, e poucas pessoas podem explicar a estrutura do modelo, rag, agente e avaliação do nível de princípio. Portanto, o repositório fornecerá toda a caligrafia e não usará a forma de chamar a API para concluir as tarefas de RAG, agente e avaliação do grande modelo.

NOTA: Considerando que alguns alunos esperam aprender a parte teórica do grande modelo antes de estudar este projeto, se quiserem estudar ainda mais a base teórica do LLM e entender e aplicar melhor o LLM com base na teoria, eles podem se referir ao curso So-Large-Llm de Datawhale.

NOTA: Se algum aluno quiser desenvolver grandes aplicativos de modelo sozinho depois de estudar este curso. Os alunos podem se referir ao curso prático de desenvolvimento de aplicativos de Big Model da Datawhale, que é um grande tutorial de desenvolvimento de aplicativos de modelo para iniciantes. O objetivo é apresentar totalmente o grande processo de desenvolvimento de aplicativos de modelo aos alunos com base no servidor de nuvem do Alibaba e combinado com projetos de assistente de base de conhecimento pessoal.

Significado do projeto

O que é um grande modelo?

Modelo grande (LLM) refere -se a modelos de processamento de linguagem natural (PNL) treinos treinados com base em algoritmos de aprendizado profundo. Eles são usados principalmente em campos, como compreensão e geração da linguagem natural. Em um sentido amplo, eles também incluem modelos grandes de visão de máquina (CV), modelos grandes multimodais e modelos grandes de computação científica.

A batalha de centenas de modelos está em pleno andamento, e os LLMs de código aberto estão surgindo um após o outro. Atualmente, muitos excelentes LLMs de código aberto surgiram em casa e no exterior, como lhama e alpaca, e internamente, como Chatglm, Baichuan, Internlm (Scholar PUYU), etc. Open Source LLM suporta a implantação local de usuários e a ajuste fina de domínios privados. Todos podem criar seu próprio modelo exclusivo com base no Open Source LLM.

No entanto, se estudantes e usuários comuns desejarem usar esses grandes modelos, eles precisam ter certos recursos técnicos para concluir a implantação e o uso dos modelos. Para LLMs de código aberto que estão surgindo um após o outro, é uma tarefa relativamente desafiadora dominar rapidamente os métodos de aplicação do Open Source LLM.

Este projeto pretende primeiro realizar os tutoriais de implantação, uso e ajuste fino do mainstream Open Source LLM em casa e no exterior com base na experiência dos principais contribuintes; Depois de realizar as partes relevantes do Mainstream LLM, esperamos reunir completamente os co-criadores para enriquecer este mundo do Open Source LLM e criar tutoriais cada vez mais abrangentes para o Special LLMS. Faíscas pontilhadas, convergindo para o mar.

Esperamos ser a escada do LLM e do público em geral e abraçar o mundo mais magnífico e vasto com o espírito de código aberto de liberdade e igualdade.

Audiência do projeto

Este projeto é adequado para os seguintes alunos:

Deseja usar ou experimentar o LLM, mas obtém ou usam incondicionalmente as APIs relevantes;
Espero aplicar LLM de maneira de longo prazo, baixo custo e em larga escala;
Interessado no Open Source LLM e deseja começar com o Open Source LLM;
A PNL está estudando, na esperança de estudar ainda mais a LLM;
Esperamos combinar o Open Source LLM para criar um LLM de domínio privado com características de domínio;
E os vastos e mais comuns grupos de estudantes.

Planejamento e progresso do projeto

Este projeto planeja organizar todo o processo de aplicação de código aberto LLM, incluindo configuração e uso ambiental, implantação e aplicação, ajuste fino etc. Cada peça cobre o mainstream e apresenta LLM de código aberto:

Exemplo de série

Chat-huanhuan: Chat-Zhen Huan é um modelo de idioma de bate-papo que imita o tom de Zhen Huan usando todas as linhas e frases sobre Zhen Huan no roteiro "The Legend of Zhen Huan" e ajuste fino com base no LLM.
Tianji: Tianji é um cenário social baseado em sentimentos humanos e estilos mundanos, abrangendo todo o processo de engenharia imediata de palavras, produção corporal inteligente, aquisição de dados e modelo de ajuste fino, limpeza e uso de dados de trapos, etc.

Modelos suportados

QWEN2.5-Coder
- QWEN2.5-CODER-7B-INSTRUTA FASTAPI LIGUE
- QWEN2.5-CODER-7B-INSTRUTA LANGCHIAN ACCESS @YANG CHENXU
- QWEN2.5-CODER-7B-Instruct WebDemo Deployment @wang zeyu
- QWEN2.5-CODER-7B-INSTRUCT VLLM Implantação @wang zeyu
- QWEN2.5-Coder-7b-Instruct Lora Fine Tuning @ Buckwheat
- QWEN2.5-Coder-7b-Instrut Lora Tuneamento fino Swanlab Visual Record Version @yang zhuo
QWEN2-VL
- QWEN2-VL-2B FASTAPI DIAGNIAÇÃO LIGUE @JIANG SHUFAN
- Qwen2-vl-2b webdemo implantação @zhao wei
- QWEN2-VL-2B VLLM IMPROVIMENTO
- QWEN2-VL-2B LORA TUNING FELE @LI KECHEN
- QWEN2-VL-2B LORA TIMELING SWANLAB Visual Record Version @ lin zeyi
- Case QWEN2-VL-2B LORA TUNING FELE-LATEXOCR @lin zeyi
Qwen2.5
- QWEN2.5-7B-INSTRUTA FASTAPI LIGUE
- QWEN2.5-7B-INSTRUTA LANGCHAIN Acesso @lou tianao
- QWEN2.5-7B-Instrut VLLM Ligue para @Jiang Shufan
- QWEN2.5-7B-Instrution Deplantação da WebDemo @gao liye
- QWEN2.5-7B-INSTRUTA LORA FINE Tuning @ zuo chunsheng
- QWEN2.5-7B-INSTRUTA IMPLEMENCIMENTAÇÃO DE CANTA DE RAÇO UMAL O1 @Jiang Shufan
- QWEN2.5-7B-INSTRUTA LORA Ajuste Swanlab Visual Record Version @lin zeyi
Apple OpenElm
- OpenLM-3B-Instrut FASTAPI DIPLATIONAÇÃO
- OpenM-3B-Instrut Lora Tuning Fine @wang zeyu
LLAMA3_1-8B-INSTRUTA
- LLAMA3_1-8B-INSTRUTA FASTAPI LIGUE DE IMPRESSÃO @Don't Scallions, Ginger, Garlic
- LLAMA3_1-8B-INSTRUTA LANGCHAIN Acesso @ zhang jin
- LLAMA3_1-8B-INSTRUCT WebDemo Deployment @Zhang Jin
- LLAMA3_1-8B-INSTRUTA LORA FINE TUNCING @Don't Scallions, Ginger and Garlic
Gemma-2-9b-it
- Gemma-2-9b-it FASTAPI NOPLEMAGENS CHAMADA @Don't Scallion, Ginger, Garlic
- Gemma-2-9b-it langchain access @ não tem cebolinha, gengibre e alho
- Gemma-2-9b-it webdemo implant @não cela, gengibre e alho
- Gemma-2-9b-it peft lora tuning fine @não a cela, gengibre e alho
Yuan2.0
- Yuan2.0-2b FASTAPI DIPLAFIMENTO LIGUE @ZHANG FAN
- Yuan2.0-2b langchain access @ zhang fã
- Yuan2.0-2b webdemo implantação @zhang fã
- Yuan2.0-2b vllm de implantação ligue para @zhang fã
- Yuan2.0-2b lora tuning finening @ zhang fã
Yuan2.0-m32
- Yuan2.0-m32 FASTAPI DESPONSÃO LIGUE @ZHANG FAN FAN
- Yuan2.0-m32 Langchain Access @ zhang fã
- Yuan2.0-M32 WebDemo Deplayment @Zhang Fan
Deepseek-Coder-V2
- Deepseek-Coder-V2-Lite-Instrut FASTAPI DIPLAFIMENTAÇÃO
- Deepseek-Coder-V2-Lite-Instruction Langchain Access @Jiang Shufan
- Deepseek-Coder-V2-Lite-Instructing Deployment @kailigithub
- Deepseek-Coder-V2-Lite-Instrut Lora Tuning Fine @yu yang
Bilibili Index-1.9b
- Index-1.9b-bate-chat FASTAPI LIGUE
- Index-1.9b-chat Langchain Access @zhang youdong
- Index-1.9b-chat webdemo implantação @september
- Índice-1.9b-bate-papo Lora Tuning Fine @Jiang Shufan
Qwen2
- QWEN2-7B-INSTRUTA FASTAPI LIGUE @KANG JINGQI
- QWEN2-7B-INSTRUTA LANGCHAIN Acesso @ não tem cebolinha, gengibre e alho
- Qwen2-7b-instruct webdemo implantação @sanshui
- QWEN2-7B-INSTRUCT VLLM LIGUEI
- QWEN2-7B-INSTRUTA LORA FINE TUNCING @ WINDE
GLM-4
- GLM-4-9B-CHAT FASTAPI DIPLAFIMENTA
- GLM-4-9B-CHAT LANGCHAIN Acesso @Tan Yike
- GLM-4-9B-CHAT WEBDEMO NOPLEMENTO @HE ZHIXUAN
- GLM-4-9B-CHAT VLLM Implementação @wang yiming
- GLM-4-9B-CHAT LORA FINE TIXO @XIAO HONGRU
- GLM-4-9B-CHAT-HF LORA FINE TUNCING @ FU ZHIYUAN
Qwen 1.5
- QWEN1.5-7B-CHAT FASTAPI LIGUE @YAN XIN
- QWEN1.5-7B CHAT LANGCHAIN Acesso @yan xin
- Qwen1.5-7b-chat webdemo implantação @yan xin
- Qwen1.5-7b-chat lora tuning fine @não picante gengibre e alho
- QWEN1.5-72B-CHAT-GPTQ-INT4 Ambiente de implantação @BYX020119
- QWEN1.5-MOE-CHAT Transformers Deployment ligue para @ding yue
- Qwen1.5-7b-chat vllm raciocínio implantação@gao liye
- QWEN1.5-7B-CHAT LORA ACESSO FINO ACESSO A SWANLAB Plataforma de Gerenciamento Experimental @Huang Bote
Google - Gemma
- Gemma-2b-it FASTAPI NOPLEMAÇÃO LIGUE @DONGDONG
- gemma-2b-it langchain Access @dongdong
- implantação gemma-2b-it webdemo @dongdong
- gemma-2b-it peft lora tuning fine @ dongdong
Phi-3
- PHI-3-MINI-4K-INSTRUTA FASTAPI LIGUE
- PHI-3-MINI-4K-INSTRUTA LANGCHAIN Acesso @Zheng Haohua
- PHI-3-MINI-4K-INSTRUCT WebDemo Deployment @ding yue
- Phi-3-mini-4K-Instruct Lora Tuneing @ding yue
Caracterlm-6b
- Caracterlm-6b Transformers implantação ligue para @sun jianzhuang
- Caracterlm-6b FASTAPI DESPENHAMENTO CHAMADA @SUN Jianzhuang
- Caracterlm-6b webdemo implantação @sun jianzhuang
- Caracterlm-6b Lora Tuneamento fino @sun jianzhuang
LLAMA3-8B-INSTRUTA
- LLAMA3-8B-INSTRUTA FASTAPI LIGUE @GAO LIYE
- LLAMA3-8B-INSTRUTA LANGCHAIN Acesso @Don't Scallions, Ginger e Alho
- LLAMA3-8B-INSTRUCT WebDemo Deployment @Don't Scallions, Ginger and Garlic
- LLAMA3-8B-INSTRUTA LORA FINE Tuning @ gao liye
Xverse-7b-bats
- Xverse-7b-Chat Transformers Diplantion Ligue para @guo zhihang
- XVERS-7B-CHAT FASTAPI LIGUE
- Xverse-7b-Chat Langchain Access @guo zhihang
- Xverse-7b-chat webdemo implantação @guo zhihang
- Xverse-7b-chat lora tuning fine @ guo zhihang
Transnormerllm
- TransNormerllm-7b-Chat FASTAPI DIPLAFIMENTA
- Transnormerllm-7b-chat langchain Access @wang maolin
- Transnormerllm-7b-chat webdemo implantação @wang maolin
- Transnormerllm-7b-chat lora ajuste fino @wang maolin
Modelo de coração azul bluelm vivo
- Bluelm-7b-Chat Fatapi Diplique @guo zhihang
- Bluelm-7b-Chat Langchain Access @guo zhihang
- Bluelm-7b-Chat WebDemo Deployment @guo zhihang
- Bluelm-7b-chat lora tuning fine @ guo zhihang
InternLM2
- InternLm2-7b-chat faspapi ligue
- Internlm2-7b-chat langchain access @ não tem cebolinha, gengibre e alho
- InternLM2-7b-Chat WebDemo Deplayment @zheng haohua
- InternLm2-7b-chat xtuner qlora tuning finering @zheng haohua
Pesquisa profunda profunda
- Deepseek-7b-Chat FASTAPI DIPLAFIMENTA
- Deepseek-7b-Chat Langchain Access @ não tem cebolinha, gengibre e alho
- Deepseek-7b-chat webdemo @não tem cebolinha, gengibre e alho
- Deepseek-7b-chat lora tuning fine @não cela, gengibre e alho
- Deepseek-7b-chat 4bits Quantitative Qlora Fine Tuning @Don't Scallions, Ginger, Garlic
- Deepseek-MOE-16B-CHAT Transformers Deployment ligue para @kailigithub
- Deepseek-MOE-16B-CHAT FASTAPI DIPLAFIMENTA
- Deepseek-Coder-6.7b Finene Colab @swiftie
- Deepseek-Coder-6.7b webdemo colab @swiftie
Minicpm
- Minicpm-2b-chat Transformers Deployment ligue para @kailigithub
- Minicpm-2b-chat FASTAPI DIPLAFIMENTO LIGUE
- Minicpm-2b-chat langchain access @ não tem cebolinha, gengibre e alho
- Minicpm-2b-chat webdemo implantação @kailigithub
- Minicpm-2b-chat lora && FELE FELE AJUS
- Link oficial: tutorial de minicpm sobre o canhão pequeno de parede @OpenBMB
- Link oficial: minicpm-cookbook @openbmb
Qwen-Audio
- QWEN-AUDIO FASTAPI DIPLATENDO LIGUE @CHEN SIZHOU
- Qwen-audio webdemo @chen sizhou
Qwen
- QWEN-7B-CHAT TRESSIMENTAÇÃO LIGUEI @LI JIAOJIAO
- QWEN-7B-CHAT FASTAPI LIGUE @LI JIAOJIAO
- Qwen-7b-chat webdemo @li jiaojiao
- Qwen-7b-chat lora tuning fine @não picante gengibre e alho
- QWEN-7B-CHAT PTUNING FINO TUNING @XIAO HONGRU
- QWEN-7B-CHAT MUITO AJUSTIMENTO FINE @Don't Scallions, Ginger and Allic
- QWEN-7B-CHAT Acesso a Langchain para construir assistente de base de conhecimento @li jiaojiao
- Treinamento de baixa precisão QWEN-7B-CAT @XIAO HONGRU
- Qwen-1_8b-chat cpu implantação @成
Mil coisas
- Yi-6b-Chat FASTAPI LIGUE @LI KECHEN
- Yi-6b-Chat Langchain Access @Li Kechen
- Yi-6b-chat webdemo @xiao hongru
- Yi-6b-chat lora tuning fine @li jiaojiao
Baichuan inteligente
- Baichuan2-7b-chat FASTAPI DIPLAFIMENTO LIGUE @HUI JIAHAO
- Baichuan2-7b-chat webdemo @hui jiahao
- Baichuan2-7b-chat acesso à estrutura de Langchain @hui jiahao
- Baichuan2-7b-chat lora tuning fine @ hui jiahao
Internlm
- Internlm-Chat-7b Transformers de implantação ligue para @小时
- Internlm-Chat-7b FASTAPI DIPLAFIMENTA
- Internlm-Chat-7b webdemo @não tem cebolinha, gengibre e alho
- Lagent+Internlm-Chat-7B-V1.1 WebDemo @Don't Scallions, Ginger and Allic
- PUYU LINGBI Entendimento e criação de textos e criação webdemo @日本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本 �
- Internlm-Chat-7b Acesso à estrutura de Langchain @Logan Zou
Atom (llama2)
- Atom-7b-chat webdemo @kailigithub
- ATOM-7B-CHAT LORA FINE TIXO @LOGAN ZOU
- Atom-7b-Chat se conecta a Langchain para construir assistente de base de conhecimento @ chen sizhou
- ATOM-7B-CHAT FELL FINE TIXO @LOGAN ZOU
Chatglm3
- Chatglm3-6b Transformers Implantação Ligue para @ding yue
- Chatglm3-6b FASTAPI DESPONSÃO LIGUE @DING YUE
- Chatglm3-6b Chat webdemo @não digo, gengibre, alho
- Chatglm3-6b Código Interpretador webdemo @não perca, gengibre, alho
- Chatglm3-6b Acesso à estrutura de Langchain @Logan Zou
- Chatglm3-6b Lora Tuneamento fino @xiao hongru

Configuração geral do ambiente

Agradecimentos

Contribuidores principais

Song Zhixue (não tem cebola, gengibre e alho)-Líder do projeto (membro da Universidade de Mineração e Tecnologia Datawhale-China (Pequim))
Zou Yuheng - líder do projeto (membro da Datawhale - Universidade de Negócios Internacionais e Economia)
Xiao Hongru (membro da Universidade Datawhale-Tongji)
Guo Zhihang (criador de conteúdo)
Fã de Zhang (membro do criador de conteúdo-Datawhale)
Jiang Shufan (Professor Assistente de Criador de Conteúdo)
Li Jiaojiao (membro de Datawhale)
Ding Yue (professor assistente de Datawhale-Jingying)
Lin Zeyi (Gerente de Produto de Criador de Conteúdo-Swanlab)
Hui Jiahao (embaixador de Datawhale-Propaganda)
Wang Maolin (membro do criador de conteúdo-Datawhale)
Sun Jianzhuang (Criador de Conteúdo-Universidade de Negócios Internacionais e Economia)
Dongdong (especialista em tecnologia de aprendizado de máquina para criador de conteúdo-Google)
Gao Liye (membro do criador de conteúdo-Datawhale)
Wang Zeyu (Conteúdo da Universidade de Tecnologia de Tecnologia de Techningying Assistant Teaching)
Kailigithub (membro do Datawhale)
Zheng Haohua (criador de conteúdo)
Li Kechen (membro de Datawhale)
Chen Sizhou (membro de Datawhale)
Walk (membro do Datawhale)
Yan Xin (Membro de Datawhale)
Trigo sarraceno (membro do criador de conteúdo-Datawhale)
Swiftie (engenheiro do algoritmo Xiaomi NLP)
Huang Bote (Universidade de Creator-Xi'an de Ciência e Tecnologia Eletrônica de Conteúdo)
Zhang Youdong (membro do criador de conteúdo-Datawhale)
Yu Yang (membro do criador de conteúdo-Datawhale)
Zhang Jin (membro do criador de conteúdo-Datawhale)
Lou Tianao (Criador de Conteúdo-Universidade da Academia Chinesa de Ciências-Ensino Assistente de Justíssia)
Zuo Chunsheng (membro do criador de conteúdo-Datawhale)
Yang Zhuo (Conteúdo Criador-Xi'an Universidade de Ciência Eletrônica e Tecnologia-Ensino Assistente de Jingventões)
Luo Luo (membro do criador de conteúdo-Datawhale)
Tan Yike (Criador de Conteúdo - Universidade de Negócios Internacionais e Economia)
Wang Yiming (membro do criador de conteúdo-Datawhale)
Ele Zhixuan (professor assistente de criador de conteúdo)
Kang Jingqi (membro do criador de conteúdo-Datawhale)
Sanshui (professor assistente de criador de conteúdo)
Setembro (Membro de Intenção do Criador de Conteúdo-Datawhale)
Deng Kaijun (membro do criador de conteúdo-Datawhale)
Yang Chenxu (Conteúdo Criador-Taiyuan University of Technology-Jingying Assistant Teaching)
Zhao Wenkai (Conteúdo da Universidade de Tecnologia de Tecnologia-Ensino Assistente de Justíssia)
Zhao Wei (professor assistente de criador de conteúdo)
Fu Zhiyuan (Universidade Criadora-Hainan)

Nota: as classificações são classificadas por nível de contribuição

outro

Agradecimentos especiais a @sm1les por sua ajuda e apoio a este projeto
Alguns Código Lora e Referência de Referência de Explicação: https://github.com/zzeds/transformers-code.git
Se você tiver alguma idéia, entre em contato conosco Datawhale. Todos são convidados a enviar uma questão.
Agradecimentos especiais aos alunos que contribuíram para o tutorial abaixo!