
التعلم النشط لتصنيف النص في بيثون.
التثبيت | بداية سريعة | مساهمة | Changelog | مستندات
يوفر النص الصغير على أحدث حالات التعلم النشط لتصنيف النص. يتم توفير العديد من استراتيجيات الاستعلام التي تم تنفيذها مسبقًا ، واستراتيجيات التهيئة ، وإيقاف Critera ، والتي يمكن خلطها بسهولة ومطابقة لبناء تجارب أو تطبيقات تعليمية نشطة.
يسمح لك التعلم النشط بتسمية بيانات التدريب بكفاءة للتعلم الخاضع للإشراف في سيناريو حيث لا يوجد لديك بيانات صغيرة أو معدومة.
الإصدار 2.0.0 dev1 (v2.0.0.dev1) - 24 نوفمبر ، 2024
الإصدار 1.4.1 (v1.4.1) - 18 أغسطس ، 2024
الإصدار 1.4.0 (v1.4.0) - 9 يونيو ، 2024
ورقة نشرت في EACL 2023؟
للحصول على قائمة كاملة من التغييرات ، راجع سجل التغيير.
يمكن تثبيت النص الصغير بسهولة عبر PIP:
pip install small-text ينتج عن الأمر تثبيت ضئيل مع التبعيات اللازمة فقط. للتثبيت الكامل عبر PIP ، تحتاج فقط إلى تضمين متطلبات transformers الإضافية:
pip install small-text[transformers]تتطلب المكتبة Python 3.8 أو أحدث. لاستخدام GPU ، مطلوب CUDA 10.1 أو الأحدث. يمكن العثور على مزيد من المعلومات المتعلقة بالتثبيت في الوثائق.
للحصول على بداية سريعة ، راجع الأمثلة المقدمة للتصنيف الثنائي ، وتصنيف Pytorch متعدد الطبقات ، وتصنيف متعدد الطبقات القائم على المحولات ، أو تحقق من دفاتر الملاحظات.
| # | دفتر | |
|---|---|---|
| 1 | مقدمة: التعلم النشط لتصنيف النص مع نص صغير | |
| 2 | باستخدام معايير التوقف للتعلم النشط | |
| 3 | التعلم النشط باستخدام setFit | |
| 4 | باستخدام إمكانيات SetFit's Zero Shot لبدء تهيئة البرد |
يمكن العثور على قائمة كاملة من المعارض في المستندات.
؟ هل ترغب في مشاركة حالة الاستخدام الخاصة بك؟ بغض النظر عما إذا كانت ورقة ، أو تجربة ، أو تطبيق عملي ، أو أطروحة ، أو مجموعة بيانات ، أو غيرها ، أخبرنا وسنضيفك إلى قسم العرض أو حتى هنا.
اقرأ أحدث وثائق هنا. تشمل الصفحات الجديرة بالملاحظة:
| اسم | التعلم النشط | |
|---|---|---|
| استراتيجيات الاستعلام | معايير وقف | |
| نص صغير V1.3.0 | 14 | 5 |
| نص صغير V2.0.0 | 19 | 5 |
نستخدم الأرقام فقط لإظهار تقدم هائل قد أحرزه النص الصغير مع مرور الوقت. هناك العديد من الميزات والتحسينات التي لا تنعكس في هذه الأرقام.
Modal ، alipy ، libact ، altoolbox
المساهمات موضع ترحيب. يمكن العثور على التفاصيل في المساهمة.
تم إنشاء هذا البرنامج بواسطة Christopher Schröder (chschroeder) في مجموعة NLP بجامعة لايبزيغ التي تعد جزءًا من شبكة أبحاث Webis. تم تمويل المشروع الشامل من قبل بنك التنمية في ساكسونيا (SAB) بموجب رقم المشروع 100335729.
تم تقديم النص الصغير بالتفصيل في ورقة عرض نظام EACL23 "النص الصغير: التعلم النشط لتصنيف النص في بيثون" والتي يمكن ذكرها على النحو التالي:
@inproceedings{schroeder2023small-text,
title = "Small-Text: Active Learning for Text Classification in Python",
author = {Schr{"o}der, Christopher and M{"u}ller, Lydia and Niekler, Andreas and Potthast, Martin},
booktitle = "Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: System Demonstrations",
month = may,
year = "2023",
address = "Dubrovnik, Croatia",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2023.eacl-demo.11",
pages = "84--95"
}
رخصة معهد ماساتشوستس للتكنولوجيا