tacotron2 tts GUI Download - tacotron2 tts GUI Code Download

tacotron2 tts GUI

كود الذكاء الاصطناعي

[Windows] GUI Portable executable (CPU only)

تنزيل

عمل واجهة المستخدم الرسومية قيد التقدم (تحديث 4 أغسطس 2020)

غلاف واجهة المستخدم الرسومية لتوليف. يسمح بتوليف وحدة المعالجة المركزية فقط عبر مفتاح قابل للتجميل. يتوفر ملف EXE المحمول (يعمل على وحدة المعالجة المركزية فقط).

يلعب أيضا تنبيهات التبرعات TTS من عناصر التيار.

واجهة المستخدم الرئيسية	دفق تكامل عناصر

ملخص

برنامج نص قائم على التعلم الآلي لبرنامج الكلام مع واجهة المستخدم الرسومية سهلة الاستخدام. يتضمن الجمهور المستهدف Twitch Streamers أو منشئي المحتوى الذين يبحثون عن برنامج TTS مفتوح المصدر. الهدف من هذا البرنامج هو جعل TTS Synthesis متاحًا في وضع عدم الاتصال (بدون تجربة ترميز ، GPU/COLAB) في EXE محمول.

سمات

يقرأ التبرعات من عناصر الدفق تلقائيًا
غلاف PYQT5 لـ NVIDIA /TACOTRON2 و /WAVEGLOW

الرابط تنزيل

يمكن العثور على قابلة للتنفيذ محمول في صفحة الإصدارات ، أو مباشرة هنا. قم بتنزيل نموذج Tacotron 2 و WaveGlow من الأسفل.

تحذير: يعمل القابل للتنفيذ المحمول على وحدة المعالجة المركزية مما يؤدي إلى تباطؤ سرعة 10x مقارنة بتشغيله على GPU.

بناء من المصدر

متطلبات

بيثون> = 3.7
Librosa
numpy
PYQT5 == 5.15.0
الطلبات
TQDM
Matplotlib
سكيبي
num2words
Pygame

Pytorch 1.0

لتشغيل

 python gui.py

رخصة

NVIDIA/TACOTRON2 & WAVEGLOW: ترخيص BSD-3-CASE

ملحوظات

رمز TTS من NVIDIA/TACOTRON2
رمز واجهة المستخدم الرسومية الجزئية من https://github.com/corentinj/real-tim-tim-voice-cloning وتخطيط مستوحى من u/realstreamer forsen tts https://www.youtube.com/watch؟v=kl2tglbcdco

الريبو الأصلي:

تاكوترون 2 (بدون Wavenet)

تنفيذ Pytorch لتوليف TTS الطبيعي عن طريق تكييف Wavenet على تنبؤات طيفية MEL.

يتضمن هذا التنفيذ دعمًا دقيقًا ومختلطًا تلقائيًا ويستخدم مجموعة بيانات LJSpeech.

يعتمد دعم الدقة المختلطة الموزعة والأوتوماتيكية على قمة NVIDIA و AMP.

تفضل بزيارة موقعنا على الويب لعينات الصوت باستخدام طرز Tacotron 2 المنشورة ونماذج WaveGlow.

المحاذاة ، المتوقعة طيفية MEL ، الهدف من MEL طيفية

المتطلبات المسبقة

NVIDIA GPU + CUDA CUDNN

يثبت

قم بتنزيل واستخراج مجموعة بيانات الكلام LJ
استنساخ هذا الريبو: git clone https://github.com/NVIDIA/tacotron2.git
القرص المضغوط في هذا الريبو: cd tacotron2
تهيئة الجهاز الفرعي: git submodule init; git submodule update
تحديث. WAV مسارات: sed -i -- 's,DUMMY,ljs_dataset_folder/wavs,g' filelists/*.txt
- بدلاً من ذلك ، قم بتعيين load_mel_from_disk=True في hparams.py وتحديث مسارات الطيف الميل
تثبيت Pytorch 1.0
تثبيت قمة
تثبيت متطلبات Python أو بناء صورة Docker
- تثبيت متطلبات Python: pip install -r requirements.txt

تمرين

python train.py --output_directory=outdir --log_directory=logdir
(اختياري) tensorboard --logdir=outdir/logdir

التدريب باستخدام نموذج تم تدريبه مسبقًا

يمكن أن يؤدي التدريب باستخدام نموذج تم تدريبه مسبقًا إلى تقارب أسرع بشكل افتراضي ، ويتم تجاهل طبقات تضمين النصوص المعتمدة على مجموعة البيانات

قم بتنزيل نموذج Tacotron 2 المنشور
python train.py --output_directory=outdir --log_directory=logdir -c tacotron2_statedict.pt --warm_start

متعدد GPU (موزعة) والتدريب الأوتوماتيكي المختلط الدقيق

python -m multiproc train.py --output_directory=outdir --log_directory=logdir --hparams=distributed_run=True,fp16_run=True

التجريبي الاستدلال

قم بتنزيل نموذج Tacotron 2 المنشور
قم بتنزيل نموذج WaveGlow المنشور
jupyter notebook --ip=127.0.0.1 --port=31337
تحميل الاستدلال

NB عند إجراء طيف الميل إلى تخليق الصوت ، تأكد من تدريب Tacotron 2 و MENCODER على نفس تمثيل طيف الميل.

repos ذات الصلة

WaveGlow أسرع من الشبكة التوليدية القائمة على التدفق في الوقت الحقيقي لتوليف الكلام

NV-Wavenet أسرع من Wavenet في الوقت الحقيقي.

شكر وتقدير

يستخدم هذا التنفيذ رمزًا من repos التالية: Keith Ito ، Prem Seetharaman كما هو موضح في الكود لدينا.

نحن مستوحى من تطبيق Ryuchi Yamamoto التاكوتون Pytorch.

نحن ممتنون لمؤلفي الورق Tacotron 2 ، وخاصة جوناثان شين ، ويوكسوان وانغ وزونغنغ يانغ.

يوسع

معلومات إضافية

الإصدار [Windows] GUI Portable executable (CPU only)
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-08-24
الحجم 1.13MB
من Github

تطبيقات ذات صلة

PPPwn Tinker GUI

2024-11-10
Anime batch downloader gui

2024-11-06
GitHub sgrebnov/cordova plugin background download

2024-11-05
Demucs Gui

2024-11-03
F5 TTS ComfyUI

2024-11-02
معلومات باللغة الإنجليزية عن تطوير الصوت (دليل مستخدم TTS إصدار دلفي)

2009-05-28

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل