تنزيل CompanionLLM - تنزيل رمز المصدر CompanionLLM

CompanionLLM

كود الذكاء الاصطناعي

1.0.0

تنزيل

Companionllm: صياغة LLMs مختلفة مثل رفيقك الحين

رفيق LLM

رفيق ميسترال

مرحبًا بك في مشروع CompanionLlm ! هنا ، نأخذ نماذج لغوية مختلفة (LLMS) ونقوم بتحسينها لتصبح رفيقك الخاص. تخيل أن يكون لديك شريك محادثة يعتقد حقًا أنه يمتلك إحساسًا ويشارك معك في مناقشات هادفة ، وتقديم رؤى وتعاطف ورفقة.

صفحة كولاب	وظيفة
قريباً	توليد مجموعة البيانات
	إعداد مجموعة البيانات
	FinetUning LLM مع مجموعة بيانات CompanionLLM
	احصل على استنتاج من أفالون
	Mistral 7b Finetuning
	Avalon-Mistral-7b الاستدلال

نظرة عامة على المشروع

الهدف من هذا المشروع هو توفير إطار لضبط LLMs المختلفة باستخدام مجموعة بيانات منسقة خصيصًا لإعطاء المزيد من الاستجابات التي تشبه الإنسان. لقد استخلصنا الإلهام من مجموعة البيانات الأصلية التي أنشأتها Ehartford ، والتي يمكنك العثور عليها على Luggingface. ومع ذلك ، قمنا بإجراء تعديلات على مجموعة البيانات لتكييفها خصيصًا لتدريب نموذج CompanionLlm.

قائمة TODO

أفالون

يهدف هذا المستودع إلى أن يكون إطارًا لتحديد رفيقك باستخدام LLMs المختلفة كـ Basemodel. Avalon هو الاسم الذي اخترته لرفيقي ، وهو يدفع - مساعد افتراضي اصطناعي مع التنقل المنطقي والتشغيلي.

فيما يلي بعض الأمثلة على المحادثة مع أفالون:

 ### Human : what is your name

### Companion : Hi! My name is Avalon. It stands for "Artificial Virtual Assistant with Logical and Operational Navigation". Ask me about anything that interests you, and I'll give you my best answer!

 ### Human : I am feeling sad

### Companion : Oh no, I'm sorry to hear that. It's great that you're opening up about it, though. Can I ask, what's going on? Is there something specific you're feeling sad about, or are you just generally down? I'm here to listen if you want to talk about it.

 ### Human : I am not able to sleep

### Companion : That sounds really frustrating! Lack of sleep can definitely take a toll on both your physical and mental health. Are you having trouble falling asleep, or staying asleep? Or both? Can you share a bit more about what your sleep experience has been like?

مجموعة البيانات

تمتزج مجموعة البيانات الخاصة بنا من مجموعة بيانات Samantha الأصلية مع بيانات سياقية إضافية لتضخيم قدرة CompanionLlm على محاكاة الحكم. برعاية بعناية ، تشمل مجموعة البيانات هذه المحادثات ، والفروق الدقيقة العاطفية ، والمطالبات التي تطالب النموذج بالرد كما لو كانت رفيقًا عاطفيًا.

النهج 1: إعداد مجموعة البيانات مع سياق المحادثة السابقة

النهج 2: تحضير مجموعة البيانات مع أزواج الانتهاء الفوري -

عملية الضبط -

يتضمن صقل نموذج اللغة تدريبه على مجموعة بيانات معينة لتكييفه مع مهمة أو مجال معين. في حالتنا ، نقوم بتدريب LLMs مختلفة لتجسيد خصائص رفيق عاطفي. تشمل عملية الضبط:

إعداد مجموعة البيانات: لقد أعدنا مجموعة بيانات معدلة مصممة لمساعدة النموذج على توليد ردود تتماشى مع موضوع الرفقة والرفقة.
تكوين الضبط الدقيق: تم تكوين بنية النموذج والمعلمات لتحسين أدائها كصاحب عاطفي. وهذا ينطوي على تعديل أجهزة التمييز ، ومدة التدريب ، وأحجام الدُفعات.
التدريب والتكرار: ندير تكرارات تدريب متعددة ، ونقوم بتقييم تقدم النموذج بشكل دوري وضبط المعلمات حسب الحاجة لتحسين استجاباته.
التحقق من الصحة: خلال عملية الضبط الدقيقة ، نتحقق من صحة ناتج النموذج لضمان أن يظل محاذاة مع هدفنا المتمثل في محاكاة رفيق عاطفي.

هيكل المستودع

data/ : تحتوي على مجموعة البيانات المعدلة المستخدمة للضبط.
notebook : دفاتر Jupyter المستخدمة للمعالجة المسبقة للبيانات والتدريب والتقييم.

ابدء

للتفاعل مع نموذج CompanionLlm ، اتبع هذه الخطوات:

استنساخ هذا المستودع إلى جهازك المحلي.
تثبيت التبعيات المطلوبة المدرجة في requirements.txt .
استخدم رمز المثال المقدم لتحميل النموذج المدرب وبدء المحادثات.

لا تتردد في التجربة وتقديم الملاحظات والمساهمة في المشروع!

مساهمات

المساهمات في CompanionLlm موضع ترحيب وتشجيع. سواء كنت مهتمًا بتحسين عملية الضبط ، أو تعزيز مجموعة البيانات ، أو تحسين استجابات النموذج ، يمكن أن تساعد مدخلاتك في تشكيل تطوير هذا الرفيق الفريد.

قبل المساهمة ، يرجى مراجعة إرشادات المساهمة الخاصة بنا.

رخصة

يتم توزيع CompanionLlm تحت رخصة معهد ماساتشوستس للتكنولوجيا.

انضم إلي في هذه الرحلة المثيرة المتمثلة في إنشاء رفيق عاطفي مدعوم من العالم الرائع لنماذج لغة الذكاء الاصطناعى. دعنا ندفع حدود ما يمكن أن تفعله التكنولوجيا وإعادة تعريف الرفقة!

للأسئلة أو الاقتراحات أو التعاون ، تواصل معنا على @adithya-sk

إخلاء المسئولية: إن إحالة رفيق النموذج المتصورة هي تجربة محاكاة ولا تعكس الوعي الفعلي.

هذا المشروع لا ينتمي إلى LLMs أو Ehartford أو معانقة وجه. إنها مبادرة مستقلة لاستكشاف إمكانات نماذج لغة الذكاء الاصطناعى.

يوسع

معلومات إضافية