Este repositorio es una colección de corpus de discurso para el reconocimiento automático de voz (ASR) y de texto a voz (TTS).
VCTK
Alrededor de 10.4gb. Anfitrión alternativo
Libriscoech
Corpus a gran escala (1000 horas) de lectura de discurso inglés.
Tedlium Release 2
El Corpus de Ted-Lium estaba hecho de charlas de audio y sus transcripciones disponibles en el sitio web de TED. Los autores han preparado y filtrado estos datos para capacitar a los modelos acústicos para participar en el Taller Internacional sobre Traducción del lenguaje hablado 2011 (el sistema Lium English/French SLT alcanzó el primer rango en la tarea SLT).
Bases de datos de CMU Arctic
Las bases de datos consisten en alrededor de 1150 enunciados, incluidos los altavoces en inglés (BDL) y femenino (SLT), así como en otros altavoces acentuados.
La Biblia en inglés mundial
La Biblia World English es una actualización de dominio público de la versión estándar estadounidense de 1901 al inglés moderno. Su texto y grabaciones de audio son libremente disponibles aquí. Desafortunadamente, sin embargo, cada uno de los archivos de audio coincide con un capítulo, no un verso, por lo que es demasiado largo en la mayoría de los casos. Kyubyong los cortó por verso manualmente. Puedes ponerlos en su Dropbox.
Nancy Corpus
Nancy Corpus del Blizzard Challenge 2011. Los datos están libremente disponibles para el uso de la investigación sobre la firma de una licencia.
Yunchao él
Weibo