ForwardTacotron NVDA
1.0.0
참고 :이 추가 기능과 문서는 여전히 건설 중입니다. 귀하의 기여는 환영합니다!
ForwardTacotron은 Pytorch의 음성 합성 모델로서 지속 시간 예측 변수를 사용하여 텍스트를 정렬하고 MEL 스펙트로 그램을 생성합니다. 이 모델에는 견고성, 속도, 피치 및 에너지 조작 및 효율성과 같은 장점이 있습니다.
따라서이 플러그인은 Torch로 사용 된 라이브러리가 NVDA에 직접 포함 할 수 없기 때문에 Client/Server를 통해 NVDA의 오픈 소스 화면 리더에서 ForwardTacotron에 대한 지원을 구현하려는 시도입니다.
이것은 진행중인 작업이므로 여전히해야 할 일이 많습니다.
그 동안, 당신은 지금까지 진행된 진전을들을 수 있습니다.
| 언어 | 목소리 | 견본 |
|---|---|---|
| 영어 | ljspeech (Griffinlim 보코더 포함) | |
| 영어 | ljspeech (hifi-gan vocoder 포함) | |
| 스페인 사람 | ALD 데이터 세트 (Hifi-gan 보코더 포함) | |
| 스페인 사람 | Odal (Hifi-gan 보코더, Universal Model) |