Téléchargement self llm - self llm Code source Télécharger

self llm

Code Source AI

1.0.0

Télécharger

Guide comestible de maquette open source

Ce projet est un tutoriel sur les modèles de bébé chinois exclusifs pour les modèles open source, pour les débutants domestiques et basés sur des plates-formes Linux. Il fournit des conseils de processus complet pour divers modèles open source, notamment la configuration environnementale, le déploiement local, le réglage des amendes efficaces et d'autres compétences, simplifiant le déploiement, l'utilisation et l'application des modèles open source, permettant à plus d'étudiants et de chercheurs ordinaires de mieux utiliser les modèles open source, aidant les modèles open source et gratuits à intégrer à la vie des apprenants ordinaires plus rapidement.

Le contenu principal de ce projet comprend:

Un guide de configuration de l'environnement LLM open source basé sur la plate-forme Linux, fournissant différentes étapes de configuration d'environnement détaillées pour différentes exigences du modèle;
Tutoriels pour le déploiement et l'utilisation de la LLM Open Source traditionnelle à la maison et à l'étranger, y compris Llama, ChatGlm, Internlm, etc.;
Conseils d'application administrative pour Open Source LLM, y compris les appels de ligne de commande, le déploiement de démonstration en ligne, l'intégration de Langchain Framework, etc.
Méthodes de réglage fin à l'échelle à grande échelle et à réglage fin efficace du LLM open source, y compris le réglage fin à grande échelle, LORA, Ptuning, etc.

Le principal contenu du projet est les tutoriels, afin que davantage d'étudiants et de futurs praticiens puissent se comprendre et se familiariser avec les méthodes de consommation de grands modèles open source! Tout le monde peut proposer un problème ou soumettre un PR pour construire conjointement et maintenir ce projet.

Les étudiants qui souhaitent participer profondément peuvent nous contacter et nous vous ajouterons au responsable du projet.

Suggestions d'apprentissage: Les suggestions d'apprentissage pour ce projet sont d'abord d'apprendre la configuration de l'environnement, puis d'apprendre le déploiement et l'utilisation du modèle, et enfin apprendre le réglage fin. Étant donné que la configuration de l'environnement est la base, le déploiement et l'utilisation du modèle sont la base et le réglage fin est avancé. Les débutants peuvent choisir Qwen1.5, interlm2, minicPM et autres modèles pour hiérarchiser l'apprentissage.

Remarque: Si les élèves veulent comprendre la composition du modèle du grand modèle et écrire des tâches telles que RAG, Agent et Eval à partir de zéro, ils peuvent apprendre un autre projet de Datawhale. Big Model est un sujet brûlant dans le domaine de l'apprentissage en profondeur à l'heure actuelle, mais la plupart des tutoriels des grands modèles existants ne sont que pour vous apprendre à appeler les API pour compléter l'application de grands modèles, et peu de gens peuvent expliquer la structure du modèle, le chiffon, l'agent et l'évaluation du niveau de principe. Par conséquent, le référentiel fournira toute l'écriture manuscrite et n'utilisera pas la forme d'appel de l'API pour terminer les tâches de chiffon, d'agent et d'évaluation du grand modèle.

Remarque: Étant donné que certains étudiants espèrent apprendre la partie théorique du grand modèle avant d'étudier ce projet, s'ils veulent étudier plus loin la base théorique de LLM et comprendre et appliquer davantage LLM sur la base de la théorie, ils peuvent se référer au cours So-Large-Llm de Datawhale.

Remarque: Si un étudiant souhaite développer de grandes applications de modèle par lui-même après avoir étudié ce cours. Les étudiants peuvent se référer au cours pratique de développement des applications de Big Model de Datawhale, qui est un tutoriel de développement des applications de gros modèle pour les novices. Il vise à présenter pleinement le processus de développement des applications du grand modèle aux étudiants en fonction du serveur Cloud Alibaba et combiné avec des projets d'assistant de base de connaissances personnelles.

Signification du projet

Qu'est-ce qu'un grand modèle?

Le grand modèle (LLM) se réfère étroitement aux modèles de traitement du langage naturel (NLP) formés en fonction des algorithmes d'apprentissage en profondeur. Ils sont principalement utilisés dans des domaines tels que la compréhension et la génération du langage naturel. Dans un sens large, ils incluent également les grands modèles de vision automatique (CV), les grands modèles multimodaux et les grands modèles informatiques scientifiques.

La bataille de centaines de modèles bat son plein, et les LLM open source émergent les uns après les autres. De nos jours, de nombreuses excellentes LLM open source ont émergé au pays et à l'étranger, comme Llama et Alpaga, et au niveau national, comme ChatGlm, Baichuan, Interlm (Scholar Puyu), etc. Open Source LLM prend en charge le déploiement local des utilisateurs et le réglage fin de domaines privés. Tout le monde peut créer son propre grand modèle unique basé sur l'Open Source LLM.

Cependant, si les étudiants et les utilisateurs ordinaires souhaitent utiliser ces grands modèles, ils doivent avoir certaines capacités techniques pour terminer le déploiement et l'utilisation des modèles. Pour les LLM open source qui émergent les uns après les autres, il est une tâche relativement difficile de maîtriser rapidement les méthodes d'application de l'Open Source LLM.

Ce projet vise à réaliser d'abord les didacticiels de déploiement, d'utilisation et de réglage fin de l'Open Source LLM traditionnel au pays et à l'étranger en fonction de l'expérience des contributeurs principaux; Après avoir réalisé les parties pertinentes de la LLM traditionnelle, nous espérons rassembler pleinement des co-créateurs pour enrichir ce monde de LLM open source et créer des tutoriels de plus en plus complets pour les LLM spéciaux. Des étincelles parsemées, convergeant dans la mer.

Nous espérons être l'échelle de LLM et du grand public, et embrasser le monde LLM plus magnifique et vaste avec l'esprit open source de liberté et d'égalité.

Audience du projet

Ce projet convient aux apprenants suivants:

Veulent utiliser ou expérimenter LLM, mais obtenir inconditionnellement ou utiliser des API pertinentes;
Espoir appliquer LLM de manière à long terme, à faible coût et à grande échelle;
Intéressé par l'Open Source LLM et je souhaite commencer avec Open Source LLM vous-même;
La PNL étudie, dans l'espoir d'étudier davantage LLM;
Nous espérons combiner Open Source LLM pour créer un domaine privé LLM avec les caractéristiques du domaine;
Et les groupes d'étudiants vastes et les plus ordinaires.

Planification et progrès du projet

Ce projet prévoit d'organiser l'intégralité du processus d'application LLM open source, y compris la configuration et l'utilisation environnementales, le déploiement et l'application, le réglage fin, etc. Chaque pièce couvre le courant et les fonctionnalités open source LLM:

Exemples de séries

Chat-Huanhuan: Chat-Zhen Huan est un modèle de langage de chat qui imite le ton de Zhen Huan en utilisant toutes les lignes et phrases sur Zhen Huan dans le script "La légende de Zhen Huan" et le réglage fin basé sur LLM.
Tianji: Tianji est un scénario social basé sur les sentiments humains et les styles mondains, couvrant l'ensemble du processus de l'ingénierie des mots rapide, de la production de corps intelligente, de l'acquisition de données et du modélisation du réglage fin, du nettoyage et de l'utilisation des données de chiffon, etc.

Modèles pris en charge

CODER QWEN2.5
- Qwen2.5-coder-7b-instruct Fastapi Deployment Call @zhao wenkai
- Qwen2.5-coder-7b-instruct Langchian Access @yang Chenxu
- Qwen2.5-coder-7b-instruct webdemo déploiement @wang zeyu
- Qwen2.5-coder-7b-instruct Vllm Deployment @wang zeyu
- Qwen2.5-coder-7b-instruct lora fine tuning @ suckwheat
- Qwen2.5-coder-7b-instruct lora affiner la version enregistrée visuelle SwanLab @yang zhuo
Qwen2-vl
- QWEN2-VL-2B FASTAPI Deployment Call @jiang shufan
- QWEN2-VL-2B DÉPLOYATION DE LA TECHNOR
- QWEN2-VL-2B Vllm Deployment @Buckwheat
- Qwen2-vl-2b lora a raffiné @li kechen
- QWEN2-VL-2B LORA FINAGING SWANLAB VISIEL VERSION VERSION @ Lin Zeyi
- QWEN2-VL-2B LORA CAS DE TUNING DE TOUR
Qwen2.5
- QWEN2.5-7B-Instruc
- Qwen2.5-7b-instruct Langchain Access @lou Tianao
- QWEN2.5-7B-Instruc
- QWEN2.5-7B-Instruc
- Qwen2.5-7b-instruct lora fine tuning @ zuo chunsheng
- QWEN2.5-7B-INSTRUCT Implémentation de la chaîne de raisonnement de type O1 @jiang shufan
- Qwen2.5-7b-instruct lora affiner la version enregistrée visuelle SwanLab @lin zeyi
Apple OpenELM
- OpenELM-3B-INSTRUCT FASTAPI Deployment Call @wang zeyu
- OpenELM-3B-INSTRUCT LORA Fine Tuning @wang Zeyu
LLAMA3_1-8B-INSTRUCT
- LLAMA3_1-8B-INSTRUCT FASTAPI Deployment Call @ Don't Scoallions, Ginger, Garlic
- LLAMA3_1-8B-INSTRUCT Langchain Access @ Zhang Jin
- LLAMA3_1-8B-INSTRUCT WebDEMO Déplacement @Zhang Jin
- Llama3_1-8b-instruct lora fine tuning @ ne pas oignons oignons, gingembre et ail
Gemma-2-9b-it
- GEMMA-2-9B-IT FASTAPI Deployment Call @ Don't Orcallion, Ginger, Aime
- Gemma-2-9b-it Langchain Access @ n'a pas d'oignons d'oignons, de gingembre et d'ail
- Gemma-2-9b-it webdemo Deploy @ ne pas oignons, gingembre et ail
- Gemma-2-9b-it peft lora fine tuning @ ne pas oignons oignons, gingembre et ail
Yuan2.0
- Yuan2.0-2b Fastapi Deployment Call @zhang fan
- Yuan2.0-2b Langchain Access @ Zhang Fan
- Yuan2.0-2b Webdemo Deployment @zhang fan
- Yuan2.0-2b Vllm Deployment Call @zhang fan
- Yuan2.0-2b lora fine-tuning @ zhang fan
Yuan2.0-m32
- Yuan2.0-M32 Déploiement Fastapi Call @zhang fan
- Yuan2.0-M32 Langchain Access @ Zhang Fan
- Yuan2.0-M32 WEBDEMO Deployment @zhang fan
Coder profonde-v2
- Deepseek-CODER-V2-LITE-INSTRUCT FASTAPI Deployment Call @Jiang Shufan
- Deepseek-CODER-V2-LITE-INSTRUCT Langchain Access @Jiang Shufan
- Deepseek-CODER-V2-LITE-INSTRUCT WEBDEMO Déplacement @Kailigithub
- Coder deek-coder-v2-lite-instruct lora fine tuning @yu yang
Bilibili Index-1.9b
- Index-1.9b-CALLE DE DÉPLAYATION FASTAPI @DENG KAIJUN
- Index-1.9b-chat Langchain Access @zhang youdong
- Index-1.9b-chat webdemo déploiement @september
- Index-1.9b-CHAT LORA Fine Tuning @Jiang Shufan
Qwen2
- QWEN2-7B-Instruc
- QWEN2-7B-Instruct Langchain Access @ n'a pas d'oignons d'oignons, de gingembre et d'ail
- QWEN2-7B-Instructe WebDemo Déploiement @Sanshui
- QWEN2-7B-INSTRUCT Vllm Deployment Call @Jiang Shufan
- Qwen2-7b-instruct lora fine tuning @ walking
GLM-4
- GLM-4-9B-CHAT FASTAPI Deployment Call @zhang youdong
- GLM-4-9B-CHAT Langchain Access @Tan Yike
- GLM-4-9B-CHAT WEBDEMO Déplacement @He Zhixuan
- GLM-4-9B-CHAT Vllm Deployment @wang yiming
- GLM-4-9B-CHAT LORA Fine Tuning @Xiao Hongru
- GLM-4-9B-CHAT-HF LORA FINE TUNING @ FU ZHIYUAN
Qwen 1.5
- QWEN1.5-7B-CALL FASTAPI APPEL DE DÉPLOYAGE @YAN XIN
- Qwen1.5-7b-chat Langchain Access @yan xin
- Qwen1.5-7b-chat Webdemo Déplacement @yan xin
- Qwen1.5-7b-chat lora fin gingeage @ ne pas ginger épicé et ail
- QWEN1.5-72B-CHAT-GPTQ-Int4 Environnement de déploiement @ BYX020119
- QWEN1.5-MOE-CHAT TRANSFORMERS DELAGEMENT CALL @DING YUE
- QWEN1.5-7B-CHAT Vllm Reasoning Deployment @ GAO LIYE
- QWEN1.5-7B-CHAT LORA AFFECTAGE ACCÈS DE LA PLATEFORME DE GESTION SWANLAB @HUANG BOTE
Google - Gemma
- GEMMA-2B-IT FASTAPI Deployment Call @dongdong
- gemma-2b-it Langchain Access @dongdong
- GEMMA-2B-IT WEBDEMO Déplacement @dongdong
- gemma-2b-it peft lora fine tuning @ dongdong
phi-3
- PHI-3-MINI-4K-Instruc
- PHI-3-MINI-4K-INSTRUCT LANGCHAIN ACCESS @ZHENG HAOHUA
- PHI-3-MINI-4K-Instruc
- PHI-3-MINI-4K-INSTRUCT LORA FINATING @DING YUE
CaracterGlm-6b
- CarterGlm-6B Transformers Déploiement Appel @Sun Jianzhuang
- COMPORTGLM-6B ENCLOYAGE FASTAPI APPEL @SUN JIANZHUANG
- CharacterGlm-6b Webdemo Déploiement @sun jianzhuang
- Characterglm-6b lora affineur @sun jianzhuang
LLAMA3-8B-INSTRUCT
- LLAMA3-8B-Instruc
- LLAMA3-8B-INSTRUCT LANGCHAIN ACCES
- LLAMA3-8B-INSTRUCT DU DEPLOYAGE DE TECHNOR
- LLAMA3-8B-INSTRUCT LORA FINE TUNNING @ GAO LIYE
Xverse-7b-bavard
- Le déploiement des transformateurs xverse-7b appelle @guo zhihang
- Xverse-7b-chat fastapi Déploiement appel @guo zhihang
- Xverse-7b-chat Langchain Access @guo zhihang
- Xverse-7b-chat webdemo déploiement @guo zhihang
- Xverse-7b-chat lora fine tuning @ guo zhihang
Transnormerllm
- TransnormerLLM-7B-CALL FASTAPI Déploiement de déploiement @wang maolin
- Transnormerllm-7b-chat Langchain Access @wang maolin
- Transnormerllm-7b-chat webdemo déploiement @wang maolin
- Transnormerllm-7b-chat lora fine tuning @wang maolin
BLUELM VIVO BLUE COEUR MODÈLE
- BLUELM-7B-CHAT FATAPI Déploiement APPEL @GUO ZHIHANG
- BLUELM-7B-CHAT LANGCHAIN ACCESS @GUO ZHIHANG
- BLUELM-7B-CHAT WEBDEMO Déplacement @guo zhihang
- BLUELM-7B-CHAT LORA FIN TUNING @ GUO ZHIHANG
Interlm2
- Internlm2-7b-chat Fastapi Deployment Appel @ Don't Orcallion, Ginger, Aime
- Internlm2-7b-chat Langchain Access @ n'a pas d'oignons d'oignons, de gingembre et d'ail
- Interlm2-7b-chat webdemo déploiement @zheng haohua
- Interlm2-7b-chat xtuner qlora affineur @zheng haohua
Recherche approfondie en profondeur
- Deepseek-7b-chat Fastapi Deployment Appel @ Don't Schec, gingembre, ail
- Deepseek-7b-chat Langchain Access @ n'a pas d'oignons d'oignons, de gingembre et d'ail
- Deepseek-7b-chat webdemo @ n'a pas d'oignons d'oignons, de gingembre et d'ail
- Deepseek-7b-chat lora fine tuning @ ne pas oignons oignons, gingembre et ail
- Deepseek-7B-CHAT 4bits Quantitative Qlora Fine Tuning @ Don't Ordanlions, Ginger, Aime
- Deepseek-MOE-16B-CHAT TRANSFORMERS DELAGEMENT CALL @KAILIGITHUB
- Deepseek-MOE-16B-CHAT FASTAPI Déploiement de déploiement @Kailigithub
- Deepseek-coder-6.7b fineune colab @swiftie
- Deepseek-coder-6.7b webdemo colab @swiftie
Minimicpm
- MINICPM-2B-CHAT TRANSFORMERS Déploiement Call @Kailigithub
- MINICPM-2B-CHAT FASTAPI Deployment Call @Kailigithub
- MINICPM-2B-CHAT LANGCHAIN ACCES
- Minicpm-2b-chat webdemo déploiement @kailigithub
- MINICPM-2B-CHAT LORA && Ajustement fin complet @ Don't Scoallions, gingembre et ail
- Lien officiel: Tutoriel MINICPM sur le petit canon orienté mur @OpenBMB
- Lien officiel: MINICPM-COOKBOOK @OpenBMB
Qwen-Audio
- Qwen-Audio Fastapi Déploiement appelez @chen sizhou
- Qwen-audio webdemo @chen sizhou
Qwen
- QWEN-7B-CHAT TRANSFORME Deployment Call @Li Jiaojiao
- QWEN-7B-CHAT FASTAPI DÉPLICATION CALL @LI JIAOJIAO
- Qwen-7b-chat webdemo @li jiaojiao
- Qwen-7b-chat lora fine tuning @ ne pas ginger épicé et ail
- QWEN-7B-CHAT PTUNING FINANT @XIAO HONGRU
- QWEN-7B-CHAT FOLUME FINE Réglage @ Don't Scoallions, Ginger et ail
- Qwen-7b-chat Accès à Langchain pour construire l'assistant de base de connaissances @li jiaojiao
- Formation à faible précision QWEN-7B-CHAT @Xiao Hongru
- QWEN-1_8B-CHAT CPU Deployment @ 成
Mille choses
- YI-6B-CHAT FASTAPI Déploiement APPEL @LI KECHEN
- Yi-6b-chat Langchain Access @li Kechen
- Yi-6b-chat webdemo @xiao hongru
- Yi-6b-chat lora fine tuning @li jiaojiao
Baichuan intelligent
- Baichuan2-7b-chat fastapi déploiement appelle @hui jahahao
- Baichuan2-7b-chat webdemo @hui jahahao
- BAICHUAN2-7B-CHAT Accès à Langchain Framework @HUi Jiahao
- Baichuan2-7b-chat lora fine tuning @ hui jahahao
Interne
- Interlm-chat-7b Transformers Deployment Call @ 小时
- Interlm-chat-7b Fastapi Deployment Call @ Don't Scoallions, Ginger et Aime
- Interlm-chat-7b webdemo @ n'a pas d'oignons d'oignons, de gingembre et d'ail
- LEGENT + INTERNLM-CHAT-7B-V1.1 Webdemo @ Don't Ordanlions, Ginger et Garlic
- Puyu Lingbi Graphique et compréhension du texte et création webdemo @ 日本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本 �
- Interlm-chat-7b Accès à Langchain Framework @Logan Zou
Atom (Llama2)
- Atom-7b-chat webdemo @kailigithub
- Atom-7b-chat lora fine tuning @logan zou
- ATOM-7B-CHAT se connecte à Langchain pour construire l'assistant de base de connaissances @ Chen Sizhou
- AtoM-7b-chat Fot Fine Tuning @Logan Zou
Chatglm3
- ChatGlm3-6b Transformers Deployment Call @ding yue
- ChatGlm3-6b Fastapi Deployment Call @ding yue
- Chatglm3-6b chat webdemo @ ne pas oignons d'oignon, gingembre, ail
- CHATGLM3-6B CODE INTERPRETER WebDemo @ Don't Schec, gingembre, ail
- CHATGLM3-6B Accès à Langchain Framework @Logan Zou
- ChatGlm3-6b lora afining @xiao hongru

Configuration générale de l'environnement

Remerciements

Contributeurs de base

Song Zhixue (ne pas avoir d'oignon, de gingembre et d'ail) -Project Leader (membre de l'Université de minage et de technologie de Datawhale-China (Pékin))
Zou Yuheng - Project Leader (membre de Datawhale - Université des affaires internationales et économiques)
Xiao Hongru (membre de l'Université Datawhale-Tongji)
Guo Zhihang (Créateur de contenu)
Fan Zhang (membre de contenu Créateur-Datawhale)
Jiang Shufan (professeur adjoint de jinging de contenu)
Li Jiaojiao (membre de Datawhale)
Ding Yue (enseignant adjoint de Jingying Datawhale)
Lin Zeyi (Content Creator-SwanLab Product Manager)
Hui Jahahao (ambassadeur de Datawhale-Propaganda)
Wang Maolin (membre du contenu Créateur-Datawhale)
Sun Jianzhuang (Créateur de contenu-University of International Business and Economics)
Dongdong (contenu Créateur-Google Developer Machine Learning Technology Expert)
Gao Liye (membre de contenu créateur-Datawhale)
Wang Zeyu (Créateur de contenu-Taiyuan University of Technology-Jingying Assistant Teaching)
Kailigithub (membre de Datawhale)
Zheng Haohua (Créateur de contenu)
Li Kechen (membre de Datawhale)
Chen Sizhou (membre de Datawhale)
Walk (membre de Datawhale)
Yan Xin (membre de Datawhale)
Suckwheat (membre de contenu créateur-Datawhale)
Swiftie (ingénieur d'algorithme NLP Xiaomi)
Huang Bote (Content Creator-Xi'an University of Electronic Science and Technology)
Zhang Youdong (membre de contenu créateur-Datawhale)
Yu Yang (membre de contenu créateur-Datawhale)
Zhang Jin (membre de contenu créateur-Datawhale)
Lou Tianao (Créateur de contenu-University of Chinese Academy of Sciences-Jingying Assistant Teaching)
Zuo Chunsheng (membre de contenu créateur-Datawhale)
Yang Zhuo (Content Creator-Xi'an University of Electronic Science and Technology-Jingying Assistant Teaching)
Luo Luo (membre de contenu créateur-Datawhale)
Tan Yike (Créateur de contenu - Université des affaires internationales et économiques)
Wang Yiming (membre de contenu créateur-Datawhale)
Il zhixuan (professeur adjoint de jinging-jinging de contenu)
Kang Jingqi (membre de contenu créateur-Datawhale)
Sanshui (professeur adjoint de jinging de contenu)
Septembre (membre du contenu Créateur-Datawhale Intention Membre)
Deng Kaijun (membre du contenu Créateur-Datawhale)
Yang Chenxu (Créateur de contenu-Taiyuan University of Technology-Jingying Assistant Teaching)
Zhao Wenkai (Créateur de contenu-Taiyuan University of Technology-Jingying Assistant Teaching)
Zhao Wei (professeur adjoint de jinging de contenu)
Fu Zhiyuan (Université de contenu créateur-hainan)

Remarque: les classements sont triés par niveau de contribution

autre

Un merci spécial à @ sm1les pour leur aide et leur soutien à ce projet
Quelques codes LORA et référentiel de référence d'explication: https://github.com/zyds/transformers-code.git
Si vous avez des idées, veuillez nous contacter Datawhale. Tout le monde est invité à soumettre un problème.
Un merci spécial aux étudiants qui ont contribué au tutoriel ci-dessous!