Download our voices model competition our voices model competition

our voices model competition

AI-Quellcode

1.0.0

Herunterladen

Unser Voices Model -Wettbewerb

Was suchen wir?
Teilnehmerpackungen
Regeln

Um

Wir wollen sehen - und Anreize! - Große Vielfalt, Gerechtigkeit und integrierte Arbeit, die mit dem gemeinsamen Sprachdatensatz geleistet werden. Wir führen einen Modell- und Methodenwettbewerb mit drei breiten Themen sowie einer offenen Kategorie durch.

Registrieren Sie Ihr Interesse

Beginnen Sie noch heute, indem Sie Ihr Interesse an diesem Formular registrieren, und Sie erhalten ein Teilnehmerpaket mit Anleitung, Ressourcen, Ratschlägen und mehr, um Ihnen zu helfen.

Bitte lesen Sie die vollständigen Regeln, wenn Sie überlegen, sich zu bewerben.

Teilnehmerpackungen

Lokalisierte Versionen der Teilnehmerpakete finden Sie auf unserem Google Drive.

Was suchen wir?

Ihr Eintrag muss in einer der folgenden Kategorien ein Modell für Vielfalt, Eigenkapital und einbekämpftes Modell oder eine Methode sein. Es muss in erster Linie Mozilla Common Voice -Daten aus der 11. Veröffentlichung (September 2022) verwenden. Außerhalb davon werden wir absichtlich offen geöffnet. Hier sind jedoch einige illustrative Beispiele;

Kategorien	Um
Geschlecht	Ein STT-Modell für eine unterressernde Sprache, die für Frauen gleich gut funktioniert
Variante, Dialekt oder Akzent	1) Beweis des Konzepts für eine unterversorgte Sprachvariante, die mit einem kleinen "Spielzeug" Corpus 2) Akzentklassifizierer durch und für eine Gemeinschaft geliefert wurde
Methoden und Maßnahmen	1) Ein Benchmark -BIAS -Korpus 2) Datensatzprüfungsmethode
Offen	Spannende Dei arbeiten hauptsächlich mit einer gemeinsamen Stimme, die nicht in die obigen Kategorien passt

Die Beurteilung wird von Sponsor oder seinen Beauftragten durchgeführt, die bei der Bestimmung der Gewinner auf der Grundlage der folgenden ebenso gewichteten Kriterien einen alleinigen Ermessensspielraum haben:

Wortfehlerrate („Wer“) - Wie viele Worterkennungsfehler Ihr Modell macht bei Verwendung in einem frischen Datensatz
Wer Punktzahl, wenn er durch Geschlecht oder Akzent -Demografie ausgeglichen ist (gemäß dem Wettbewerbsthema)
Dienstprogramm - Dies ist ein Urteilswert durch Diskussionsteilnehmer, in denen bewertet wird, wie effektiv, originell und nützlich Ihre Methode oder Messung sein würde
Sozialer Bedürfnis / Ökosystemwert - Ob dieses Modell dem Universum anderer Modelle für dieselbe Sprache einen Mehrwert verleiht. Wir disqualifizieren keine Einsendungen, die nicht Open Source sind, sondern wenn wir in der breiteren Rubrik einen Wert von Ökosystemen in Betracht ziehen, werden wir die Lizenz betrachten, unter der Ihre Arbeit verfügbar ist.
Bereitstellbarkeitsbewertung - Dies ist ein Urteilswert von Diskussionsteilnehmern, in denen bewertet wird, wie einfach dies in einer Anwendung zu installieren wäre
Umweltverträglichkeitsprüfungsbewertung (über GPU -Nutzung) - Dies enthält zwei Komponenten - Experten -Panel -Bewertung plus erforderliche Bereitstellung ihrer Verarbeitungsstatistiken - auch bekannt als "Hunger" ist Ihr Modell? Ist es geschrieben, effizient zu sein?

Wie stellen Sie sicher, dass es für alle Sprachen einfach ist, teilzunehmen?

Wir ermutigen aktiv Einreichungen in der Proof of Concept -Phase, die einen kleinen oder „Spielzeug“ -Korpus verwenden
Mit unserer Kategorie Methodology and Methods können Teams Umrisse für Tools einreichen, die sie noch nicht über die Ressourcen verfügen, um weiter auszubauen
Wir haben einen Monat Entwicklungszeit zugelassen, um diejenigen zu erhalten, die sich auf CPU / langsamere Berechnung verlassen
Sprachen werden in 'Bands' - hohe Ressource, mittlere Ressourcen und niedrige Ressource - beurteilt, um einen gerechteren Wettbewerb zwischen Sprachen zu gewährleisten, die in verschiedenen Kontexten existieren
Wir erstellen eine flexible, ganzheitliche Rubrik, die es den Richtern ermöglicht, den Ekosystem-Wert-Add
Für marginalisierte Gemeinden, die Bedenken hinsichtlich der Veröffentlichung ihres Modells im Rahmen einer Open -Source -Lizenz haben, können sie eine Erklärung in diesem Effekt einlegen, und dies wird entsprechend berücksichtigt

Unsere Richter

Wer ist die Jury?

Professor Francis Tyers - Computer -Linguistikberater, Mozilla Foundation & Academic, University of Indiana Indiana
Dr. Vitaly Lavrukhin - Principal angewandter Forschungswissenschaftler, Nvidia
Wiebke Hutiri - Doktorand an der Delft University of Technology - Fairness in Voice Tech
Dr. Abeba Birhane - AI Fellow Mozilla
Rebecca Ryakitimbo - Community Fellow, Kiswahili
Britone Mwasaru - Gemeinschaftsfried, Kiswahili
Dr. Josh Meyer-Mitbegründer, Coqui
Stefania delprete - Datenwissenschaftler und italienischer MCV Community Rep
Kathy Reid - PhD -Kandidat an der Australian National University - Voreingenommenheit in Sprachtechnik, Open Source
Gabriel Habayeb - Senior Data Engineer, Mozilla Foundation

Einreichungsprozess

Um Ihren Code für den Wettbewerb einzureichen, sollten Sie Folgendes tun:

Geben Sie dieses Repository in GitHub.
Erstellen Sie ein neues Verzeichnis in einem Unterverzeichnis von Submit/, das der Kategorie entspricht, in der Sie einreichen möchten.
Verpflichten Sie und geben Sie Ihren Code in diese Unterverzeichnis in Ihrer Gabel.
Öffnen Sie eine Pull -Anfrage für dieses Repository.
Sie müssen dann Ihre endgültige Einreichung mit diesem Formular vornehmen . Einreichungen, die nicht über die Typform eingereicht werden, können nicht berücksichtigt werden .

Expandieren

Zusätzliche Informationen