مسابقة نموذج أصواتنا
- ما الذي نبحث عنه؟
- حزم المشاركين
- قواعد
عن
نريد أن نرى - وتحفيز! - التنوع الكبير ، والإنصاف والشمول العمل الذي يجري القيام به مع مجموعة البيانات الصوتية المشتركة. نحن ندير المنافسة نموذجًا وطرقًا مع ثلاثة موضوعات عريضة ، بالإضافة إلى فئة مفتوحة.
سجل اهتمامك
ابدأ اليوم عن طريق تسجيل اهتمامك بهذا النموذج ، وستتلقى حزمة مشاركين مع التوجيه والموارد والمشورة والمزيد لمساعدتك.
يرجى قراءة القواعد الكاملة إذا كنت تفكر في التقديم.
حزم المشاركين
يمكن العثور على الإصدارات المترجمة من حزم المشاركين على محرك Google.
ما الذي نبحث عنه؟
يجب أن يكون إدخالك نموذجًا أو طريقة تنوعًا واعتماً على الأسهم والوصول إلى إحدى الفئات التالية. يجب أن تستفيد بشكل أساسي من بيانات صوتية مشتركة من موزيلا من الإصدار 11 (سبتمبر 2022). خارج هذا ، نحن مفتوحون عمدا. ومع ذلك ، إليك بعض الأمثلة التوضيحية ؛
| فئات | عن |
|---|
| جنس | نموذج STT للغة غير المرتبطة بالأداء بشكل جيد للنساء |
| البديل أو لهجة أو لهجة | 1) إثبات مفهوم لمتغير اللغة الذين يعانون من نقص الخدمات يتم تسليمه باستخدام مجموعة صغيرة من "لعبة" كوربوس 2) |
| الطرق والتدابير | 1) مجموعة التحيز القياسية 2) منهجية تدقيق مجموعة البيانات |
| يفتح | تعمل DEI المثيرة في المقام الأول باستخدام صوت مشترك لا يتناسب مع الفئات المذكورة أعلاه |
سيتم الحكم من قبل الراعي أو المصممون ، الذين يكونون سلطة تقديرية خاصة في تحديد الفائزين بناءً على المعايير التالية على قدم المساواة:
- معدل خطأ الكلمات ("WER") - كم عدد أخطاء التعرف على الكلمات التي يرتكبها نموذجك عند استخدامها على مجموعة بيانات جديدة
- درجات عندما توازن بين الجنسين أو التركيبة السكانية لهجة (حسب موضوع المنافسة)
- الأداة المساعدة - هذا هو تسجيل الحكم من قبل أعضاء اللجنة الذين يقيمون مدى فعالية وأصلي ومفيدة طريقة أو قياسك
- القيمة الاجتماعية / قيمة النظام الإيكولوجي - ما إذا كان هذا النموذج يضيف قيمة إلى عالم النماذج الأخرى لنفس اللغة. نحن لا نستبعد التقديمات التي لا تكون مفتوحة المصدر ، ولكن عند النظر في قيمة قيمة النظام الإيكولوجي ضمن النموذج الأوسع ، سننظر في الترخيص الذي يتوفر بموجبه عملك.
- تصنيف قابلية النشر - هذا هو تسجيل الحكم من قبل أعضاء اللجنة يقيمون مدى سهولة التثبيت في التطبيق
- تصنيف التأثير البيئي (عبر استخدام GPU) - هذا له عنصرين - تصنيف لوحة الخبراء بالإضافة إلى توفير الإحصائيات المعالجة الخاصة بهم - ويعرف أيضًا باسم "الجياع" هو نموذجك؟ هل هو مكتوب لتكون فعالة؟
كيف تتأكد من أنه من السهل على جميع اللغات المشاركة؟
- نحن نشجع بنشاط التقديمات في مرحلة إثبات المفهوم التي تستخدم مجموعة صغيرة أو "لعبة"
- تمكن فئة المنهجية والأساليب الخاصة بنا الفرق من تقديم الخطوط العريضة للأدوات التي لا تملكها بعد الموارد اللازمة للبناء أكثر
- لقد سمحنا لمدة شهر من وقت التطوير لاستيعاب أولئك الذين يعتمدون على حساب وحدة المعالجة المركزية / أبطأ
- سيتم الحكم على اللغات داخل "النطاقات" - الموارد العالية والموارد المتوسطة والموارد المنخفضة - لضمان منافسة أكثر عدلاً بين اللغات الموجودة في سياقات مختلفة
- نحن ننشئ نموذجًا شموليًا مرنًا مما يجعل من الممكن للقضاة أن ينظروا إلى عوامل القيمة المضافة للنظام الإيكولوجي بما يتجاوز مقاييس الأداء مثل معدل خطأ الكلمات
- بالنسبة للمجتمعات المهمشة التي لديها مخاوف بشأن الحوكمة بشأن إصدار نموذجهم بموجب ترخيص مفتوح المصدر ، فإنهم مرحب بهم لتقديمه مع تفسير بهذا المعنى ، وسيتم النظر في ذلك وفقًا لذلك
قضاةنا
من هي لجنة التحكيم؟
- البروفيسور فرانسيس تيرز - مستشار اللغويات الحسابية ، مؤسسة موزيلا والأكاديمي ، جامعة إنديانا
- الدكتور فيتالي لافروكين - عالم الأبحاث التطبيقية الرئيسية ، نفيديا
- Wiebke Hutiri - مرشح دكتوراه في جامعة دلفت للتكنولوجيا - الإنصاف في التكنولوجيا الصوتية
- الدكتورة أبيبا بيرهان - منظمة العفو الدولية زميل موزيلا
- ريبيكا رياكتيمبو - زميل المجتمع ، كيسواهيلي
- Britone Mwasaru - زميل المجتمع ، Kiswahili
- الدكتور جوش ماير- المؤسس المشارك ، كويكي
- ستيفانيا ديلبريت - عالم البيانات وممثل مجتمع MCV الإيطالي
- كاثي ريد - مرشح دكتوراه في الجامعة الوطنية الأسترالية - التحيز في تقنية الكلام ، المصدر المفتوح
- غابرييل هابايب - كبار مهندسي البيانات ، مؤسسة موزيلا
عملية التقديم
من أجل إرسال رمزك للمسابقة ، يجب عليك القيام بما يلي:
- شوكة هذا المستودع في جيثب.
- قم بإنشاء دليل جديد في دليل فرعي للإرسال/ يتوافق مع الفئة التي تريد إرسالها.
- ارتكب وادفع الرمز الخاص بك إلى هذا الدليل الفرعي في شوكة.
- افتح طلب سحب لهذا المستودع.
- يجب عليك بعد ذلك تقديم التقديم النهائي باستخدام هذا النموذج. التقديمات التي لا يتم تقديمها عبر typeform لن تكون قادرة على النظر .