Unser Voices Model -Wettbewerb
- Was suchen wir?
- Teilnehmerpackungen
- Regeln
Um
Wir wollen sehen - und Anreize! - Große Vielfalt, Gerechtigkeit und integrierte Arbeit, die mit dem gemeinsamen Sprachdatensatz geleistet werden. Wir führen einen Modell- und Methodenwettbewerb mit drei breiten Themen sowie einer offenen Kategorie durch.
Registrieren Sie Ihr Interesse
Beginnen Sie noch heute, indem Sie Ihr Interesse an diesem Formular registrieren, und Sie erhalten ein Teilnehmerpaket mit Anleitung, Ressourcen, Ratschlägen und mehr, um Ihnen zu helfen.
Bitte lesen Sie die vollständigen Regeln, wenn Sie überlegen, sich zu bewerben.
Teilnehmerpackungen
Lokalisierte Versionen der Teilnehmerpakete finden Sie auf unserem Google Drive.
Was suchen wir?
Ihr Eintrag muss in einer der folgenden Kategorien ein Modell für Vielfalt, Eigenkapital und einbekämpftes Modell oder eine Methode sein. Es muss in erster Linie Mozilla Common Voice -Daten aus der 11. Veröffentlichung (September 2022) verwenden. Außerhalb davon werden wir absichtlich offen geöffnet. Hier sind jedoch einige illustrative Beispiele;
| Kategorien | Um |
|---|
| Geschlecht | Ein STT-Modell für eine unterressernde Sprache, die für Frauen gleich gut funktioniert |
| Variante, Dialekt oder Akzent | 1) Beweis des Konzepts für eine unterversorgte Sprachvariante, die mit einem kleinen "Spielzeug" Corpus 2) Akzentklassifizierer durch und für eine Gemeinschaft geliefert wurde |
| Methoden und Maßnahmen | 1) Ein Benchmark -BIAS -Korpus 2) Datensatzprüfungsmethode |
| Offen | Spannende Dei arbeiten hauptsächlich mit einer gemeinsamen Stimme, die nicht in die obigen Kategorien passt |
Die Beurteilung wird von Sponsor oder seinen Beauftragten durchgeführt, die bei der Bestimmung der Gewinner auf der Grundlage der folgenden ebenso gewichteten Kriterien einen alleinigen Ermessensspielraum haben:
- Wortfehlerrate („Wer“) - Wie viele Worterkennungsfehler Ihr Modell macht bei Verwendung in einem frischen Datensatz
- Wer Punktzahl, wenn er durch Geschlecht oder Akzent -Demografie ausgeglichen ist (gemäß dem Wettbewerbsthema)
- Dienstprogramm - Dies ist ein Urteilswert durch Diskussionsteilnehmer, in denen bewertet wird, wie effektiv, originell und nützlich Ihre Methode oder Messung sein würde
- Sozialer Bedürfnis / Ökosystemwert - Ob dieses Modell dem Universum anderer Modelle für dieselbe Sprache einen Mehrwert verleiht. Wir disqualifizieren keine Einsendungen, die nicht Open Source sind, sondern wenn wir in der breiteren Rubrik einen Wert von Ökosystemen in Betracht ziehen, werden wir die Lizenz betrachten, unter der Ihre Arbeit verfügbar ist.
- Bereitstellbarkeitsbewertung - Dies ist ein Urteilswert von Diskussionsteilnehmern, in denen bewertet wird, wie einfach dies in einer Anwendung zu installieren wäre
- Umweltverträglichkeitsprüfungsbewertung (über GPU -Nutzung) - Dies enthält zwei Komponenten - Experten -Panel -Bewertung plus erforderliche Bereitstellung ihrer Verarbeitungsstatistiken - auch bekannt als "Hunger" ist Ihr Modell? Ist es geschrieben, effizient zu sein?
Wie stellen Sie sicher, dass es für alle Sprachen einfach ist, teilzunehmen?
- Wir ermutigen aktiv Einreichungen in der Proof of Concept -Phase, die einen kleinen oder „Spielzeug“ -Korpus verwenden
- Mit unserer Kategorie Methodology and Methods können Teams Umrisse für Tools einreichen, die sie noch nicht über die Ressourcen verfügen, um weiter auszubauen
- Wir haben einen Monat Entwicklungszeit zugelassen, um diejenigen zu erhalten, die sich auf CPU / langsamere Berechnung verlassen
- Sprachen werden in 'Bands' - hohe Ressource, mittlere Ressourcen und niedrige Ressource - beurteilt, um einen gerechteren Wettbewerb zwischen Sprachen zu gewährleisten, die in verschiedenen Kontexten existieren
- Wir erstellen eine flexible, ganzheitliche Rubrik, die es den Richtern ermöglicht, den Ekosystem-Wert-Add
- Für marginalisierte Gemeinden, die Bedenken hinsichtlich der Veröffentlichung ihres Modells im Rahmen einer Open -Source -Lizenz haben, können sie eine Erklärung in diesem Effekt einlegen, und dies wird entsprechend berücksichtigt
Unsere Richter
Wer ist die Jury?
- Professor Francis Tyers - Computer -Linguistikberater, Mozilla Foundation & Academic, University of Indiana Indiana
- Dr. Vitaly Lavrukhin - Principal angewandter Forschungswissenschaftler, Nvidia
- Wiebke Hutiri - Doktorand an der Delft University of Technology - Fairness in Voice Tech
- Dr. Abeba Birhane - AI Fellow Mozilla
- Rebecca Ryakitimbo - Community Fellow, Kiswahili
- Britone Mwasaru - Gemeinschaftsfried, Kiswahili
- Dr. Josh Meyer-Mitbegründer, Coqui
- Stefania delprete - Datenwissenschaftler und italienischer MCV Community Rep
- Kathy Reid - PhD -Kandidat an der Australian National University - Voreingenommenheit in Sprachtechnik, Open Source
- Gabriel Habayeb - Senior Data Engineer, Mozilla Foundation
Einreichungsprozess
Um Ihren Code für den Wettbewerb einzureichen, sollten Sie Folgendes tun:
- Geben Sie dieses Repository in GitHub.
- Erstellen Sie ein neues Verzeichnis in einem Unterverzeichnis von Submit/, das der Kategorie entspricht, in der Sie einreichen möchten.
- Verpflichten Sie und geben Sie Ihren Code in diese Unterverzeichnis in Ihrer Gabel.
- Öffnen Sie eine Pull -Anfrage für dieses Repository.
- Sie müssen dann Ihre endgültige Einreichung mit diesem Formular vornehmen . Einreichungen, die nicht über die Typform eingereicht werden, können nicht berücksichtigt werden .