تقطير المعرفة الخاصة بالمهمة من BERT إلى شبكات عصبية بسيطة
ما مدى فعالية زيادة بيانات المهام في المهام للمحولات المسبقة؟
حان وقت المورفين! مكافحة التمييز اللغوي مع الاضطرابات الانتقالية
ملخص
مسح مرئي لزيادة البيانات في NLP
زيادة البيانات المستقلة عن المهام لـ NLP
قوية وغير متحيزة معالجة اللغة الطبيعية PDF
طُرق
عام
إدراج عشوائي ، حذف ، كلمة ، جملة خلط
استبدال الكلمات بالمرادفات
استبدال الكلمات من dicitionary من نفس التسمية
نير
الاضطرابات (رسالة أو كلمة أو مستوى جملة)
noisemix
نموذج اللغة
زيادة السياق
ترجمة الظهر
الجهاز traslation
ترجمة ذهابا وإيابا
التورط
كوربوسات متوازية منخفضة الموارد
中文文本纠错任务
الاستفادة من البيانات الخارجية
باستخدام البيانات الخارجية المستمدة من ويكيبيديا. ربط مقالات ويكيبيديا بنص الإدخال التعسفي. والفكرة هي أنه إذا كان نص الإدخال على ويكيبيديا ، فسيكون لها روابط لمقالات ويكيبيديا الأخرى (التي ترتبط بشكل دلالي وتقديم معلومات إضافية).
كسر نص الإدخال إلى n-grams
تحقق مما إذا كان كل n-gram موجود كمقال ويكيبيديا لإنشاء مجموعة من "روابط المرشحين"
تقليم الروابط المرشح عن طريق حساب تشابه نص الإدخال وملخص كل مرشح