يحتوي هذا المستودع على جميع الموارد لورشة عمل أيام التعلم الآلي التطبيقي تلبية نفسك الاصطناعية: إنشاء نص يبدو مثلك.
في ورشة العمل هذه ، يتم تكليف المشاركين بتنزيل سجلات الدردشة الخاصة بهم وإنشاء روبوت دردش يولد نصًا مشابهًا لكتابهم. كبديل لاستخدام سجلات الدردشة ، فإننا نقدم عددًا من مجموعات بيانات المحادثة الأخرى (وغير المحادثة) في هذا المستودع.
لا تتردد في الانضمام إلى Gitter أثناء ورشة العمل:
ابحث عن شرائح ورشة العمل هنا.
تنقسم ورشة العمل في 3 مهام. يمكنك تشغيل كل مهمة محليًا (عن طريق استنساخ هذا المستودع) أو عن طريق تشغيل دفتر Colab Notebook (انظر الروابط أدناه). إذا قمت بتشغيل محليًا ، فتأكد من إمكانية الوصول إلى GPU (S) وقمت بتشغيل Python 3.6+ (أيضًا تأكد من أن لديك مساحة تخزين كافية). يتم توفير المزيد من التعليمات التفصيلية في المجلدات الفرعية المختلفة.
GPT-2 صميم على مجموعات البيانات المختلفة (بما في ذلك التغريدات والشعر ورمز البرمجة والشطرنج والموسيقى والمزيد!). بفضل manueth لتجميع مجموعات البيانات!
➡ اقرأ المزيد
نستخدم نفس النهج لنقل الأسلوب لتدريب نموذج المحادثة من سجلات الدردشة الخاصة بنا. يمكنك إما استخدام الدردشة لتحليل سجلات الدردشة الخاصة بك أو يمكنك استخدام بعض الموارد المقدمة. بفضل @MastersCrat لتجميع مجموعات البيانات المحادثة!
➡ اقرأ المزيد
نقوم بتوسيع النهج في المهمة 2 من خلال إدخال التعلم متعدد المهام ، وتحسين المعالجة المسبقة للبيانات ، وإضافة أنواع رمزية.
➡ اقرأ المزيد