رهيبة tts-samples
قائمة أوراق TTS مع عينات صوتية قدمها المؤلفون. تُظهر الصفوف الأخيرة من كل ورقة انعكاس الطيف (Vocoder) المستخدمة.
للحصول على قائمة أكثر شمولاً من أوراق TTS المهمة ، أوصي بقراءة XCMYZ/خطاب التذوق المكتوبة بواسطة Zhengxi Liu.
2020
- fastpitch-fastpitch: نص متوازي إلى كلام مع التنبؤ بالملعب
- https://fastpitch.github.io/
- WaveGlow
- الأكل-النص العادي الشامل إلى الكلام
- https://deepmind.com/research/publications/end-to-end-adversarial-text-to-appeech
- نموذج من طرف إلى طرف
- Glow-tts-Glow-TTS: تدفق توليدي للنص إلى الكلام عن طريق البحث المحاذاة الرتيبة
- https://jaywalnut310.github.io/glow-tts-demo
- WaveGlow
- Flowtron-FlowTron: شبكة توليد قائم على التدفق التلقائي لتوليف النص إلى الكلام
- https://nv-adlr.github.io/flowtron
- WaveGlow
2019
- Tacotron2+DCA-آليات الانتباه في الموقع لتوليف الكلام القوي طويل الشكل
- https://google.github.io/tacotron/publications/location_relative_attention
- ويفرن
- GAN -TTS - تخليق الكلام عالي الإخلاص مع شبكات الخصومة
- https://storage.googleapis.com/deepmind-media/research/abstract.wav
- نموذج من طرف إلى طرف (مبني على ميزات الملعب اللغوية وسجل 200 هرتز))
- Tacotron2 متعدد اللغات-تعلم التحدث بطلاقة بلغة أجنبية: تخليق الكلام متعدد اللغات والاستنساخ الصوتي عبر اللغة
- https://google.github.io/tacotron/publications/Multingual
- ويفرن
- Melnet - Melnet: نموذج توليدي للصوت في مجال التردد
- https://audio-samples.github.io
- https://sjvasquez.github.io/blog/melnet
- انعكاس الطيف القائم على التدرج
- Fastspeech - Fastspeech: نص سريع وقوي وقابل للتحكم في الكلام
- https://speechresearch.github.io/fastspeech
- WaveGlow
- Paranet-النص العصبي الموازي إلى الكلام
- https://paralled-neural-tts-demo.github.io
- Wavevae ، Clarinet ، Wavenet
2018
- Transformer -TTS - تخليق الكلام العصبي مع شبكة المحولات
- https://neuraltts.github.io/transformertts
- Wavenet
- Multi-Speaker Tacotron2-نقل التعلم من التحقق من مكبر الصوت إلى تخليق النص إلى الكلام متعدد النطق
- https://google.github.io/tacotron/publications/speaker_adptation
- Wavenet
- TACOTRON2+GST-نمط الرموز: نمذجة النمذجة غير الخاضعة للإشراف والتحكم والنقل في تخليق الكلام الشامل
- https://google.github.io/tacotron/publications/global_style_tokens
- غريفين-ليم
2017
- Tacotron2 - تخليق TTS الطبيعي عن طريق تكييف Wavenet على تنبؤات طيفية MEL
- https://google.github.io/tacotron/publications/tacotron2
- Wavenet
- تاكوترون-تاكوترون: نحو تخليق الكلام الشامل
- https://google.github.io/tacotron/publications/tacotron
- غريفين-ليم
المساهمة
تودو