Nossa competição de modelos de vozes
- O que estamos procurando?
- Pacotes de participantes
- Regras
Sobre
Queremos ver - e incentivar! - Grande diversidade, equidade e trabalho consciente da inclusão que está sendo feito com o conjunto de dados de voz comum. Estamos executando uma competição de modelo e métodos com três temas amplos, além de uma categoria aberta.
Registre seu interesse
Comece hoje registrando seu interesse neste formulário e você receberá um pacote de participantes com orientação, recursos, conselhos e muito mais para ajudá -lo.
Leia as regras completas se estiver pensando em aplicar.
Pacotes de participantes
As versões localizadas dos pacotes de participantes podem ser encontradas em nossa unidade do Google.
O que estamos procurando?
Sua entrada deve ser um modelo ou método ou método consciente da diversidade, equidade e inclusão em uma das seguintes categorias. Ele deve usar principalmente os dados de voz comuns do Mozilla da 11ª versão (setembro de 2022). Fora disso, estamos sendo deliberadamente abertos. No entanto, aqui estão alguns exemplos ilustrativos;
| Categorias | Sobre |
|---|
| Gênero | Um modelo STT para uma linguagem com pouca recursos que tem um desempenho igualmente bom para as mulheres |
| Variante, dialeto ou sotaque | 1) Prova de conceito para uma variante de linguagem mal atendida entregue com um pequeno corpus 'brinquedo' 2) Classificadores de sotaques por, e para uma comunidade |
| Métodos e medidas | 1) Um Bandesty de Benchmark Corpus 2) Metodologia de Auditoria do DataSet |
| Abrir | Dei emocionante trabalha principalmente usando a voz comum que não se encaixa nas categorias acima |
O julgamento será feito pelo patrocinador ou seus designados, que terão critério exclusivo na determinação dos vencedores com base nos seguintes critérios igualmente ponderados:
- Taxa de erro de palavra ("WER") - Quantos erros de reconhecimento de palavras seu modelo cometem quando usado em um novo conjunto de dados
- Pontuar quando equilibrado por demografia de gênero ou sotaque (conforme o tema da competição)
- Utilidade - esta é uma pontuação de julgamento dos membros do painel avaliando o quão eficaz, original e útil seu método ou medida seria
- Valor de necessidade social / ecossistema - se esse modelo agrega valor ao universo de outros modelos para o mesmo idioma. Não desqualificamos envios que não são de código aberto, mas ao considerar o valor agregado do ecossistema dentro da rubrica mais ampla, consideraremos a licença sob a qual seu trabalho está disponível.
- Classificação de implantabilidade - Esta é uma pontuação de julgamento dos membros do painel avaliando como seria fácil instalar em um aplicativo
- Classificação de impacto ambiental (via uso da GPU) - Isso possui dois componentes - classificação de painel de especialistas, além de provisão necessária de suas estatísticas de processamento - também conhecida como 'faminto' é o seu modelo? Está escrito para ser eficiente?
Como você está se certificando de que é fácil para todos os idiomas participar?
- Estamos incentivando ativamente envios em fase de prova de conceito que usam um corpus pequeno ou 'brinquedo'
- Nossa categoria de metodologia e métodos permite que as equipes enviem contornos para ferramentas que eles ainda não têm os recursos para criar mais adiante
- Permitimos um mês de tempo de desenvolvimento para acomodar aqueles que confiam na CPU / computação mais lenta
- Os idiomas serão julgados em 'bandas' - de alto recurso, recursos médios e baixo recurso - para garantir uma concorrência mais justa entre idiomas que existem em diferentes contextos
- Estamos criando uma rubrica flexível e holística que possibilita que os juízes observem fatores de valor agregado do ecossistema além das métricas de desempenho, como taxa de erro de palavra
- Para comunidades marginalizadas que têm preocupações de governança em liberar seu modelo sob uma licença de código aberto, eles são bem -vindos a se submeter com uma explicação para esse efeito, e isso será considerado de acordo
Nossos juízes
Quem são o painel de julgamento?
- Professor Francis Tyers - Conselheiro de Linguística Computacional, Mozilla Foundation & Academic, Universidade de Indiana Indiana
- Dr. Vitaly Lavrukhin - Cientista da Pesquisa Aplicada Principal, Nvidia
- Wiebke Hutiri - PhD Candidate na Universidade de Tecnologia de Delft - Fairness in Voice Tech
- Dr. Abeba Birhane - Ai companheiro Mozilla
- Rebecca Ryakitimbo - Community Community, Kiswahili
- BRITONE MWASARU - COMUNICO COMUNITY, KISWAHILI
- Dr. Josh Meyer- co-fundador, Coqui
- Stefania Delprete - Cientista de dados e representante da comunidade italiana MCV
- Kathy Reid - Candidato de PhD na Universidade Nacional Australiana - Viés em Tecnologia de Speech, Open Source
- Gabriel Habayeb - Engenheiro de Dados Sênior, Mozilla Foundation
Processo de envio
Para enviar seu código para a concorrência, você deve fazer o seguinte:
- Fork este repositório no GitHub.
- Crie um novo diretório em um subdiretório de envio/ que corresponda à categoria em que deseja enviar.
- Compromete e empurre seu código para esse subdiretório em seu garfo.
- Abra uma solicitação de tração a este repositório.
- Você deve fazer seu envio final usando este formulário. Os envios que não são enviados pelo TypeForm não poderão ser considerados .