Speech Corpus Collection
1.0.0
이 repo는 자동 음성 인식 (ASR) 및 TTS (Text-Steece)를위한 Speech Corpus 모음입니다.
vctk
약 10.4GB. 대체 호스트
librispeech
읽기 영어 연설의 대규모 (1000 시간) 코퍼스.
Tedlium 릴리스 2
Ted-Lium 코퍼스는 오디오 토크와 TED 웹 사이트에서 이용할 수있는 전사로 만들어졌습니다. 저자들은 음성 언어 번역 2011에 대한 국제 워크숍에 참여하도록 어쿠스틱 모델을 훈련시키기 위해 이러한 데이터를 준비하고 필터링했습니다 (LIUM 영어/프랑스 SLT 시스템은 SLT 작업의 첫 번째 순위에 도달했습니다).
CMU 북극 데이터베이스
데이터베이스는 미국 영어 남성 (BDL) 및 여성 (SLT) 스피커 및 기타 악센트 스피커를 포함하여 약 1150 개의 발언으로 구성됩니다.
세계 영어 성경
World English Bible은 1901 년 미국 표준 버전의 현대 영어로 공개 도메인 업데이트입니다. 텍스트와 오디오 녹음은 여기에서 자유롭게 유발할 수 있습니다. 그러나 불행히도 각 오디오 파일은 구절이 아닌 장과 일치하므로 대부분의 경우 너무 길다. Kyubyong은 수동으로 구절로 얇게 썰었습니다. 당신은 그의 드롭 박스에 그들을 얻을 수 있습니다.
낸시 코퍼스
2011 블리자드 챌린지의 낸시 코퍼스. 데이터는 라이센스 서명에 대한 연구 용도로 자유롭게 이용할 수 있습니다.
Yunchao 그는
와이보