يوفر هذا المستودع إطارًا للتصنيف المستند إلى النماذج اللغوية التي تم تدريبها مسبقًا ، مع التركيز على مهام تصنيف النص الفارسي. ويشمل البرامج النصية وأجهزة الكمبيوتر المحمولة لتوليد المطالبات ، ومطالبات الضبط للتصنيف ، وتقييم النتائج ، وتحليل مقاييس أداء النموذج مثل درجة F1 والدقة والاستدعاء. يدعم المستودع أيضًا تعلم K-Shot لتعزيز القدرة على التكيف من خلال دمج الأمثلة ذات الصلة.
الرموز : يحتوي على الكود الأساسي وأجهزة الكمبيوتر المحمولة للتدريب النموذجي ، والتوليد المطالبات ، والتقييم.
AYA-Colab.ipynb : دفتر ملاحظات رئيسي للتدريب وصياغة المطالبات مع طرز AYA على كولاب.Classification_report.ipynb : يولد مقاييس التصنيف ، بما في ذلك درجة F1 ، والدقة ، واستدعاء لإعدادات سريعة مختلفة.Creating_dataset.ipynb : إعداد البيانات وإنشاء مجموعة البيانات للتعلم القائم على المطالبة.f1-calculation.py : البرنامج النصي Python لحساب وتصور درجات F1.news-aya-symbol-tuning.ipynb : دفتر ملاحظات لضبط الرموز مع نماذج AYA لتصنيف النص.news-aya-system-user-prompt.ipynb : البرنامج النصي لإنشاء نظام ومستخدم المستخدم باستخدام نموذج لغة تم تدريبه مسبقًا.Symbol_tuning_aya.ipynb : دفتر توليف الرمز لتحسين فعالية المطالبة.مجموعات البيانات : يحتوي على مجموعات بيانات تستخدم للتدريب والتقييم.
مطالبات : يحتوي على قوالب سريعة تستخدم لمهام التصنيف المختلفة.
الشرائح : ملفات التوثيق والعرض التي تشرح التعلم داخل السياق ، والتصميم السريع ، وتعلم K-Shot ، وضبط الرموز.
In-Context Learning.pptx In-Context Learning.pdfSystem-User Prompt Design.pptx و System-User Prompt Design.pdf : دليل لتصميم النظام ومطالبات المستخدمين.Symbol Tuning.pptx & Symbol Tuning.pdf : تعليمات حول استخدام ضبط الرمز لتحسين أداء المطالبة. استنساخ المستودع:
git clone https://github.com/ShayanSalehi81/BachelorProject
cd BachelorProjectتثبيت الحزم المطلوبة:
pip install -r requirements.txtالمصادقة بوجه معانقة (إذا لزم الأمر) وتثبيت مكتبات إضافية:
huggingface-cli login --token YOUR_HUGGINGFACE_TOKEN قم بتشغيل أي من أجهزة الكمبيوتر المحمولة أو البرامج النصية Python في دليل Codes لتنفيذ مهام مثل إنشاء مجموعة البيانات ، أو ضبط موجه ، أو تقييم.
Generator بتحميل نموذج لغة تم تدريبه مسبقًا ، ويطالب التنسيقات ، وينشئ تنبؤات. يدعم البرنامج النصي تقدير 4 بت لاستخدام الذاكرة الفعال ويعزز المطالبات التي يقدمها المستخدم لتصنيف بيانات الأخبار الفارسية على أنها "مهمة" أو "غير مهمة".news-aya-symbol-tuning.ipynb و Symbol_tuning_aya.ipynb لضبط الرموز المطالبة ، والتي يمكن أن تحسن تفسير النموذج واتساق الاستجابة. يقدم توليف الرموز تعديلات طفيفة على المطالبات ، مما يعزز فهم النموذج للاستعلامات الدقيقة. Creating_dataset.ipynb للمعالجة المسبقة وتنسيق مجموعة البيانات الخاصة بك.news-aya-system-user-prompt.ipynb لتحديد المطالبات والمستخدم ، وتشغيل التصنيف على مجموعة البيانات.Classification_report.ipynb لحساب المقاييس مثل الدقة ودرجة F1 و f1-calculation.py لتصور الأداء.news-aya-symbol-tuning.ipynb لتحسين التصميم السريع مع ضبط الرموز. هذا المشروع مرخص بموجب ترخيص معهد ماساتشوستس للتكنولوجيا.
المساهمات مرحب بها! لا تتردد في تقديم المشكلات أو طلبات الميزات أو سحب طلبات تحسين هذا المشروع.