رفيق LLM![]() | رفيق ميسترال![]() |
مرحبًا بك في مشروع CompanionLlm ! هنا ، نأخذ نماذج لغوية مختلفة (LLMS) ونقوم بتحسينها لتصبح رفيقك الخاص. تخيل أن يكون لديك شريك محادثة يعتقد حقًا أنه يمتلك إحساسًا ويشارك معك في مناقشات هادفة ، وتقديم رؤى وتعاطف ورفقة.
| صفحة كولاب | وظيفة |
|---|---|
| قريباً | توليد مجموعة البيانات |
| إعداد مجموعة البيانات | |
| FinetUning LLM مع مجموعة بيانات CompanionLLM | |
| احصل على استنتاج من أفالون | |
| Mistral 7b Finetuning | |
| Avalon-Mistral-7b الاستدلال |
الهدف من هذا المشروع هو توفير إطار لضبط LLMs المختلفة باستخدام مجموعة بيانات منسقة خصيصًا لإعطاء المزيد من الاستجابات التي تشبه الإنسان. لقد استخلصنا الإلهام من مجموعة البيانات الأصلية التي أنشأتها Ehartford ، والتي يمكنك العثور عليها على Luggingface. ومع ذلك ، قمنا بإجراء تعديلات على مجموعة البيانات لتكييفها خصيصًا لتدريب نموذج CompanionLlm.
يهدف هذا المستودع إلى أن يكون إطارًا لتحديد رفيقك باستخدام LLMs المختلفة كـ Basemodel. Avalon هو الاسم الذي اخترته لرفيقي ، وهو يدفع - مساعد افتراضي اصطناعي مع التنقل المنطقي والتشغيلي.
فيما يلي بعض الأمثلة على المحادثة مع أفالون:
### Human : what is your name
### Companion : Hi! My name is Avalon. It stands for "Artificial Virtual Assistant with Logical and Operational Navigation". Ask me about anything that interests you, and I'll give you my best answer!
### Human : I am feeling sad
### Companion : Oh no, I'm sorry to hear that. It's great that you're opening up about it, though. Can I ask, what's going on? Is there something specific you're feeling sad about, or are you just generally down? I'm here to listen if you want to talk about it.
### Human : I am not able to sleep
### Companion : That sounds really frustrating! Lack of sleep can definitely take a toll on both your physical and mental health. Are you having trouble falling asleep, or staying asleep? Or both? Can you share a bit more about what your sleep experience has been like?
تمتزج مجموعة البيانات الخاصة بنا من مجموعة بيانات Samantha الأصلية مع بيانات سياقية إضافية لتضخيم قدرة CompanionLlm على محاكاة الحكم. برعاية بعناية ، تشمل مجموعة البيانات هذه المحادثات ، والفروق الدقيقة العاطفية ، والمطالبات التي تطالب النموذج بالرد كما لو كانت رفيقًا عاطفيًا.
يتضمن صقل نموذج اللغة تدريبه على مجموعة بيانات معينة لتكييفه مع مهمة أو مجال معين. في حالتنا ، نقوم بتدريب LLMs مختلفة لتجسيد خصائص رفيق عاطفي. تشمل عملية الضبط:
إعداد مجموعة البيانات: لقد أعدنا مجموعة بيانات معدلة مصممة لمساعدة النموذج على توليد ردود تتماشى مع موضوع الرفقة والرفقة.
تكوين الضبط الدقيق: تم تكوين بنية النموذج والمعلمات لتحسين أدائها كصاحب عاطفي. وهذا ينطوي على تعديل أجهزة التمييز ، ومدة التدريب ، وأحجام الدُفعات.
التدريب والتكرار: ندير تكرارات تدريب متعددة ، ونقوم بتقييم تقدم النموذج بشكل دوري وضبط المعلمات حسب الحاجة لتحسين استجاباته.
التحقق من الصحة: خلال عملية الضبط الدقيقة ، نتحقق من صحة ناتج النموذج لضمان أن يظل محاذاة مع هدفنا المتمثل في محاكاة رفيق عاطفي.
data/ : تحتوي على مجموعة البيانات المعدلة المستخدمة للضبط.notebook : دفاتر Jupyter المستخدمة للمعالجة المسبقة للبيانات والتدريب والتقييم. للتفاعل مع نموذج CompanionLlm ، اتبع هذه الخطوات:
requirements.txt .لا تتردد في التجربة وتقديم الملاحظات والمساهمة في المشروع!
المساهمات في CompanionLlm موضع ترحيب وتشجيع. سواء كنت مهتمًا بتحسين عملية الضبط ، أو تعزيز مجموعة البيانات ، أو تحسين استجابات النموذج ، يمكن أن تساعد مدخلاتك في تشكيل تطوير هذا الرفيق الفريد.
قبل المساهمة ، يرجى مراجعة إرشادات المساهمة الخاصة بنا.
يتم توزيع CompanionLlm تحت رخصة معهد ماساتشوستس للتكنولوجيا.
انضم إلي في هذه الرحلة المثيرة المتمثلة في إنشاء رفيق عاطفي مدعوم من العالم الرائع لنماذج لغة الذكاء الاصطناعى. دعنا ندفع حدود ما يمكن أن تفعله التكنولوجيا وإعادة تعريف الرفقة!
للأسئلة أو الاقتراحات أو التعاون ، تواصل معنا على @adithya-sk
إخلاء المسئولية: إن إحالة رفيق النموذج المتصورة هي تجربة محاكاة ولا تعكس الوعي الفعلي.
هذا المشروع لا ينتمي إلى LLMs أو Ehartford أو معانقة وجه. إنها مبادرة مستقلة لاستكشاف إمكانات نماذج لغة الذكاء الاصطناعى.