Notre concours de modèles de voix
- Qu'est-ce que nous recherchons?
- Packs de participants
- Règles
À propos
Nous voulons voir - et inciter! - Une grande diversité, des actions et des travaux soucieux de l'inclusion se terminant avec l'ensemble de données vocale commun. Nous organisons un concours de modèles et de méthodes avec trois thèmes généraux, ainsi qu'une catégorie ouverte.
Enregistrez votre intérêt
Commencez dès aujourd'hui en enregistrant votre intérêt avec ce formulaire, et vous recevrez un pack de participants avec des conseils, des ressources, des conseils et plus pour vous aider.
Veuillez lire les règles complètes si vous envisagez de postuler.
Packs de participants
Des versions localisées des packs de participants se trouvent sur notre Google Drive.
Que cherchons-nous?
Votre entrée doit être une diversité, un modèle ou une méthode soucieuse de l'inclusion dans l'une des catégories suivantes. Il doit principalement utiliser les données vocales communes de Mozilla à partir de la 11e version (septembre 2022). En dehors de cela, nous sommes délibérément ouverts. Cependant, voici quelques exemples illustratifs;
| Catégories | À propos |
|---|
| Genre | Un modèle STT pour un langage sous-ressourcé qui fonctionne aussi bien pour les femmes |
| Variante, dialecte ou accent | 1) Preuve de concept pour une variante linguistique sous-servante livrée avec un petit corpus `` jouet '' 2) des classificateurs d'accentuation par et pour une communauté |
| Méthodes et mesures | 1) Un corpus de biais de référence 2) Méthodologie d'audit de l'ensemble de données |
| Ouvrir | Dei passionnant travaille principalement en utilisant une voix commune qui ne rentre pas dans les catégories ci-dessus |
Le jugement sera fait par le sponsor ou ses concepteurs, qui aura une seule discrétion dans la détermination des gagnants en fonction des critères également pondérés suivants:
- Taux d'erreur des mots («wer») - Combien d'erreurs de reconnaissance de mots que votre modèle est utilisée lorsqu'il est utilisé sur un nouveau jeu de données
- Score wer lorsqu'il est équilibré par le genre ou l'accent démographique (selon le thème de la compétition)
- Utilité - Il s'agit d'un score de jugement par les panélistes évaluant l'efficacité, l'original et utile que votre méthode ou votre mesure serait
- Besoin social / valeur écosystémique - si ce modèle ajoute de la valeur à l'univers d'autres modèles pour la même langue. Nous ne disqualifions pas les soumissions qui ne sont pas open source, mais lorsque nous considérons la valeur de l'écosystème ADD dans la rubrique plus large, nous considérerons la licence sous laquelle votre travail est disponible.
- Évaluation de déploiement - Il s'agit d'un score de jugement par les panélistes évaluant à quel point cela serait facile d'installer dans une application
- Évaluation d'impact environnemental (via l'utilisation du GPU) - Cela a deux composants - la cote de panneau d'experts plus la fourniture requise de leurs statistiques de traitement - alias comment est «affamé» votre modèle? Est-il écrit pour être efficace?
Comment vous assurez-vous qu'il est facile pour toutes les langues de participer?
- Nous encourageons activement les soumissions au stade de la preuve de concept qui utilisent un petit ou un corpus «jouet»
- Notre catégorie de méthodologie et de méthodes permet aux équipes de soumettre des contours pour les outils qu'ils n'ont pas encore les ressources pour développer
- Nous avons autorisé un mois de temps de développement pour accueillir ceux qui s'appuient sur le processeur / calcul plus lent
- Les langues seront jugées dans des «bandes» - ressources élevées, ressources moyennes et ressources faibles - pour assurer une concurrence plus juste entre les langues qui existent dans différents contextes
- Nous créons une rubrique holistique flexible qui permet aux juges d'examiner les facteurs de valeur de la valeur de l'écosystème au-delà des mesures de performance comme le taux d'erreur de mots
- Pour les communautés marginalisées qui ont des problèmes de gouvernance concernant la publication de leur modèle sous une licence open source, ils sont invités à se soumettre avec une explication à cet effet, et cela sera considéré en conséquence
Nos juges
Qui sont le jury?
- Professeur Francis Tyers - Computational Linguistics Advisor, Mozilla Foundation & Academic, University of Indiana Indiana
- Dr Vitaly Lavrukhin - Principal Research Scientist, NVIDIA
- Wiebke Hutiri - Docat de doctorat à l'Université de technologie de Delft - Équité en technologie vocale
- Dr Abeba Birhane - AI Fellow Mozilla
- Rebecca Ryakitimbo - Fellow de la communauté, Kiswahili
- Britone Mwasaru - Fellow de la communauté, Kiswahili
- Dr Josh Meyer- co-fondateur, Coqui
- Stefania Delprete - Data Scientist et Italian MCV Community Rep
- KATHY REID - CHANDE DE PHD à l'Australian National University - Biais in Speech Tech, Open Source
- Gabriel Habayeb - Ingénieur de données senior, Fondation Mozilla
Processus de soumission
Afin de soumettre votre code pour le concours, vous devez effectuer ce qui suit:
- Fourk ce référentiel dans GitHub.
- Créez un nouveau répertoire dans un sous-répertoire de soumission / qui correspond à la catégorie dans laquelle vous souhaitez soumettre.
- Commissez et poussez votre code à ce sous-répertoire de votre fourchette.
- Ouvrez une demande de traction vers ce référentiel.
- Vous devez ensuite faire votre soumission finale en utilisant ce formulaire. Les soumissions qui ne sont pas soumises via la forme de type ne pourront pas être prises en compte .