
هذا المشروع هو برنامج تعليمي عن نماذج الأطفال الصينية الحصرية لنماذج المصادر المفتوحة ، للمبتدئين المحليين ويستند إلى منصات Linux. إنه يوفر إرشادات كاملة للعملية لمختلف النماذج المفتوحة المصدر بما في ذلك التكوين البيئي ، والنشر المحلي ، والضغط الدقيق والمهارات الأخرى الفعالة ، وتبسيط عملية النشر والاستخدام والتقديم للنماذج المفتوحة المصدر ، والسماح لمزيد من الطلاب والباحثين العاديين باستخدام نماذج مفتوحة المصدر بشكل أفضل ، ومساعدة النماذج المفتوحة على المصدر والنماذج المجانية للتكامل في حياة المتعلمين العاديين.
تشمل المحتويات الرئيسية لهذا المشروع:
المحتوى الرئيسي للمشروع هو البرامج التعليمية ، بحيث يمكن للمزيد من الطلاب والممارسين المستقبليين فهم وتعريف أنفسهم بطرق تناول نماذج كبيرة مفتوحة المصدر! يمكن لأي شخص اقتراح مشكلة أو تقديم العلاقات العامة لإنشاء هذا المشروع وصيانته بشكل مشترك.
يمكن للطلاب الذين يرغبون في المشاركة بعمق الاتصال بنا وسنضيفك إلى مشروع المشروع.
اقتراحات التعلم: تتمثل اقتراحات التعلم لهذا المشروع في تعلم تكوين البيئة أولاً ، ثم تعلم نشر النموذج واستخدامه ، وأخيراً تعلم ضبطها. نظرًا لأن تكوين البيئة هو الأساس ، فإن نشر واستخدام النموذج هو الأساس ، ويتم صرف التثبيت. يمكن للمبتدئين اختيار QWEN1.5 و Internlm2 و MinicPM وغيرها من النماذج لتحديد أولويات التعلم.
ملاحظة: إذا أراد الطلاب فهم تكوين النموذج للنموذج الكبير وكتابة مهام مثل Rag ، Agent و Eval من نقطة الصفر ، فيمكنهم تعلم مشروع آخر من DataWhale. يعد Big Model موضوعًا ساخنًا في مجال التعلم العميق في الوقت الحالي ، ولكن معظم البرامج التعليمية النموذجية الكبيرة الحالية هي فقط لتعليمك كيفية الاتصال بآبار واجهات برمجة التطبيقات لإكمال تطبيق النماذج الكبيرة ، ويمكن لقلة من الأشخاص شرح بنية النموذج والخرقة والوكيل والتقييم من المستوى الرئيسي. لذلك ، سيوفر المستودع جميع الكتابة اليدوية ولا يستخدم شكل استدعاء واجهة برمجة التطبيقات لإكمال مهام RAC و AGENT و EVAL للنموذج الكبير.
ملاحظة: بالنظر إلى أن بعض الطلاب يأملون في تعلم الجزء النظري من النموذج الكبير قبل دراسة هذا المشروع ، إذا كانوا يرغبون في زيادة دراسة الأساس النظري لـ LLM وفهم LLM وتطبيقه على أساس النظرية ، فيمكنهم الإشارة إلى دورة Datawhale-Large-LALM.
ملاحظة: إذا كان أي طالب يريد تطوير تطبيقات نموذجية كبيرة بنفسه بعد دراسة هذه الدورة. يمكن للطلاب الرجوع إلى دورة تطوير تطبيقات DataWhale التدريبية الكبيرة ، وهو برنامج تعليمي كبير لتطوير تطبيقات النموذج للمبتدئين. ويهدف إلى تقديم عملية تطوير تطبيقات النموذج الكبير للطلاب بناءً على خادم Alibaba Cloud ودمجت مع مشاريع مساعدة قاعدة المعرفة الشخصية.
ما هو النموذج الكبير؟
يشير النموذج الكبير (LLM) بشكل ضيق إلى نماذج معالجة اللغة الطبيعية (NLP) المدربين على أساس خوارزميات التعلم العميق. يتم استخدامها بشكل أساسي في مجالات مثل فهم اللغة الطبيعية وتوليدها. بمعنى واسع ، تشمل أيضًا نماذج كبيرة من رؤية الآلة (CV) ، نماذج كبيرة متعددة الوسائط ونماذج كبيرة للحوسبة العلمية.
معركة المئات من النماذج على قدم وساق ، وتظهر LLMs مفتوحة المصدر واحدة تلو الأخرى. في الوقت الحاضر ، ظهرت العديد من LLMs مفتوحة المصدر الممتازة في الداخل والخارج ، مثل Llama و Alpaca ، وبشكل محلي ، مثل ChatGlm و Baichuan و Internlm (Scholar Puyu) ، إلخ. يمكن للجميع إنشاء نموذج كبير فريد من نوعه استنادًا إلى Open Source LLM.
ومع ذلك ، إذا كان الطلاب والمستخدمون العاديون يرغبون في استخدام هذه النماذج الكبيرة ، فيجب أن يكون لديهم قدرات تقنية معينة لإكمال نشر النماذج واستخدامها. بالنسبة إلى LLMs مفتوح المصدر الناشئة واحدة تلو الأخرى ، فهي مهمة صعبة نسبيًا لإتقان أساليب تطبيق LLM المفتوحة المصدر بسرعة.
يهدف هذا المشروع إلى إدراك أولاً نشرات النشر والاستخدام والتعليميات التي يتمتع بها LLM السائد في المنزل والخارج بناءً على تجربة المساهمين الأساسيين ؛ بعد إدراك الأجزاء ذات الصلة من LLM السائد ، نأمل أن نجمع بالكامل من المؤرخين المشاركين لإثراء هذا العالم من LLM مفتوح المصدر وإنشاء دروس أكثر وأكثر شمولية ل LLMs الخاصة. شرارة منقط ، تتقارب في البحر.
نأمل أن نكون سلم LLM وعامة الناس ، وأن نحتضن عالم LLM الأكثر روعة وشاسعة مع روح المصدر المفتوح للحرية والمساواة.
هذا المشروع مناسب للمتعلمين التاليين:
يخطط هذا المشروع لتنظيم العملية الكاملة لتطبيق LLM مفتوح المصدر ، بما في ذلك التكوين البيئي واستخدامه ، والنشر والتطبيق ، والضبط ، وما إلى ذلك.
Chat-Huanhuan: Chat-Zhen Huan هو نموذج لغة الدردشة يقلد لهجة تشن هوان باستخدام جميع الخطوط والجمل حول Zhen Huan في السيناريو "The Legend of Zhen Huan" والضغط الدقيق على أساس LLM.
Tianji: Tianji هو سيناريو اجتماعي يعتمد على المشاعر الإنسانية والأساليب الدنيوية ، ويغطي عملية هندسة الكلمات الفوري الكاملة ، وإنتاج الجسم الذكي ، والاكتساب البيانات ، ونماذج النموذج ، وتنظيف بيانات الخرقة واستخدامها ، وما إلى ذلك.
QWEN2.5-CODER
Qwen2-VL
Qwen2.5
Apple Openelm
llama3_1-8b-instruct
GEMMA-2-9B-IT
يوان 2.0
Yuan2.0-M32
Deepseek-CoDer-V2
Bilibili Index-1.9b
Qwen2
GLM-4
Qwen 1.5
جوجل - جيما
PHI-3
حرف Glm-6b
llama3-8b-instruct
Xverse-7b-Chat
transnormerllm
نموذج قلب Bluelm Vivo Blue
Internlm2
ديبسيك بحث متعمق
minicpm
Qwen-Audio
Qwen
ألف شيء
بايتشوان ذكي
Internlm
ذرة (llama2)
ChatGlm3
Pip ، Conda Change Source @ ليس لديك البصل ، الزنجبيل ، الثوم
AutoDL Open Port @Don Donting Ginger and Garlic
تنزيل النموذج
إصدار && pr
ملاحظة: يتم فرز التصنيف حسب مستوى المساهمة
