Соревнование по моделям модели голосов
- Что мы ищем?
- Участники упаковки
- Правила
О
Мы хотим увидеть - и стимулировать! - Большое разнообразие, справедливость и инклюзивная работа, выполняемая с общим набором данных голоса. Мы проводим конкуренцию модели и методов с тремя широкими темами, а также открытой категорией.
Зарегистрируйте свой интерес
Начните сегодня, зарегистрировав свой интерес с этой формой, и вы получите пакет участников с руководством, ресурсами, советами и многом другом, чтобы помочь вам.
Пожалуйста, прочитайте полные правила, если вы планируете подавать заявку.
Участники упаковки
Локализованные версии пакетов участников можно найти на нашем Google Drive.
Что мы ищем?
Ваша запись должна быть моделью разнообразия, справедливости и сознания или метода включения в одну из следующих категорий. Он должен в первую очередь использовать голосовые данные Mozilla Common с 11 -го релиза (сентябрь 2022 г.). Помимо этого, мы намеренно открыты. Однако вот несколько иллюстративных примеров;
| Категории | О |
|---|
| Пол | Модель STT для языка с недостаточным ресурсом, которая одинаково хорошо работает для женщин |
| Вариант, диалект или акцент | 1) Доказательство концепции для недостаточно обслуживаемого языкового варианта, доставленного с небольшим «игрушечным» Corpus 2) Акцентные классификаторы и для сообщества |
| Методы и меры | 1) Методология аудита наборов данных Clound BIAS 2) |
| Открыть | Захватывающий DEI работает в основном с использованием общего голоса, который не вписывается в приведенные выше категории |
Судья будет сделано спонсором или его назначенными лицами, которые должны иметь единоличное усмотрение при определении победителей на основе следующих одинаково взвешенных критериев:
- Скорость ошибок Word («WER») - Сколько ошибок распознавания слов ваша модель делает при использовании в свежем наборе данных
- Оценка, когда сбалансирован по гендерным или акцентным демографии (согласно теме соревнований)
- Утилита - это суждение, оцененное участниками дискуссии, оценивающего, насколько эффективен, оригинальный и полезный ваш метод или мера будет
- Значение социальных потребностей / экосистемы - добавляет ли эта модель ценность во вселенную других моделей для одного и того же языка. Мы не дисквалифицируем представления, которые не являются открытым исходным кодом, но при рассмотрении экосистемного добавления в более широкой рубрике мы рассмотрим лицензию, по которой доступна ваша работа.
- Рейтинг развертываемости - это суждение, оцененное участниками дискуссии, оценивающего, насколько легко это будет установить в приложении
- Рейтинг воздействия на окружающую среду (через использование графического процессора) - это имеет два компонента - оценка экспертов, плюс необходимое предоставление их статистики обработки - как «Голодный» - ваша модель? Это написано, чтобы быть эффективным?
Как вы убедитесь, что для всех языков легко участвовать?
- Мы активно поощряем представления на стадии подтверждения концепции, которые используют небольшой или «игрушечный» корпус
- Наша категория методологии и методов позволяет командам представлять схемы для инструментов, которые у них еще нет ресурсов для дальнейшего создания
- Мы разрешили месяц разработки, чтобы приспособить те, кто полагается на ЦП / более медленный вычислитель
- Языки будут оцениваться в рамках «полос» - высокий ресурс, средний ресурс и низкий ресурс - чтобы обеспечить более справедливую конкуренцию между языками, которые существуют в разных контекстах
- Мы создаем гибкую, целостную рубрику, которая позволяет судьям взглянуть на факторы экосистемы.
- Для маргинализированных сообществ, которые испытывают проблемы с управлением по поводу выпуска своей модели по лицензии с открытым исходным кодом, они могут представить с объяснением этого эффекта, и это будет рассмотрено соответственно
Наши судьи
Кто является судейской комиссией?
- Профессор Фрэнсис Тайерс - консультант по вычислительной лингвистике, Mozilla Foundation & Academic, Университет штата Индиана
- Доктор Витали Лаврухин - главный прикладной научный сотрудник, NVIDIA
- Wiebke Hutiri - кандидат доктора философии в Технологическом университете Делфта - Справедливость в голосовой технологии
- Доктор Абеба Бирхан - Ай -товарищ Мозилла
- Ребекка Райакитимбо - общинный член, Кисвахили
- Britone Mwasaru - общинный член, Kiswahili
- Доктор Джош Мейер- соучредитель, Coqui
- Stefania delprete - ученый для данных и итальянский представитель сообщества MCV
- Кэти Рейд - кандидат доктора философии в Австралийском национальном университете - предвзятость в речевых технологиях, с открытым исходным кодом
- Габриэль Хабайеб - старший инженер данных, Mozilla Foundation
Процесс подачи
Чтобы отправить свой код для конкурса, вы должны сделать следующее:
- Вилка этого хранилища в GitHub.
- Создайте новый каталог в подкаталоге от отправки/, который соответствует категории, в которой вы хотите отправить.
- Сделайте и подтолкните свой код в этот подкаталог в вилке.
- Откройте запрос на притяжение в этот репозиторий.
- Затем вы должны сделать свое окончательное представление, используя эту форму. Материалы, которые не представлены через типовую форму , не смогут быть рассмотрены .