تنفيذ TensorFlow من DeepMind's Tacotron-2. بنية الشبكة العصبية العميقة الموصوفة في هذه الورقة: تخليق TTS الطبيعي عن طريق تكييف Wavenet على تنبؤات MEL Spectogram
tacotron-2-mandarin-griffin-lim
|--- datasets
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- papers
|--- prepare
|--- tacotron
|--- models
|--- utils
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- training_data
|--- audio
|--- linear
|--- mels
هناك بعض عينات التوليف هنا.
يمكنك الحصول على نموذج ما قبل المسبق هنا.
OS: Ubuntu 16.04
الخطوة (0) - مستودع استنساخ GIT
git clone https://github.com/atomicoo/tacotron2-mandarin.git
cd tacotron-2-mandarin-griffin-lim/
الخطوة (1) - تثبيت التبعيات
تثبيت Python 3 (Python-3.5.5 بالنسبة لي)
تثبيت TensorFlow (Tensorflow-1.10.0 بالنسبة لي)
تثبيت تبعيات أخرى
pip install -r requirements.txt
الخطوة (2) - إعداد مجموعة البيانات
قم بتنزيل مجموعة البيانات biaobei أو thchs-30
بعد ذلك ، يجب أن تكون شجرة المستند الخاصة بك:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BZNSYP
|--- ProsodyLabeling
|--- 000001-010000.txt
|--- Wave
|--- ...
إعداد مجموعة البيانات (الافتراضي هو BIAOBEI )
python prepare_dataset.py
إذا قمت بإعداد THCHS-30 ، فيمكنك استخدام المعلمة- --dataset=THCHS-30 .
بعد ذلك ، يمكنك الحصول على مجلد BIAOBEI على النحو التالي:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- BIAOBEI
|--- biaobei_48000
|--- ...
مجموعة بيانات المعالجة المسبقة (الافتراضي هو BIAOBEI )
python preprocess.py
إذا كانت prrprocessing THCHS-30 ، فيمكنك استخدام المعلمة- --dataset=THCHS-30 .
بعد ذلك ، يمكنك الحصول على مجلد training_data على النحو التالي:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- training_data
|--- audio
|--- linear
|--- mels
|--- train.txt
|--- ...
الخطوة (3) - طراز Train Tacotron
python train.py
المزيد من المعلمات ، يرجى الاطلاع على Train.py.
بعد ذلك ، يمكنك الحصول على logs-Tacotron على النحو التالي:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- logs-Tacotron
|--- eval-dir
|--- plots
|--- taco_pretrained
|--- wavs
|--- ...
الخطوة (4) - توليف الصوت
python synthesize.py
المزيد من المعلمات ، يرجى الاطلاع على synthesize.py.
بعد ذلك ، يمكنك الحصول على مجلد tacotron_output على النحو التالي:
tacotron-2-mandarin-griffin-lim
|--- ...
|--- tacotron_output
|--- eval
|--- logs-eval
|--- plots
|--- wavs
|--- ...
Rayhane-Mamah/Tacotron-2