تنزيل LightSpeech - تنزيل رمز مصدر LightSpeech

LightSpeech

كود الذكاء الاصطناعي

1.0.0

تنزيل

Lightspeech

تنفيذ Pytorch غير رسمي لـ Lightspeech: نص خفيف وسريع إلى الكلام مع البحث عن العمارة العصبية. يستخدم هذا الريبو تنفيذ Fastspeech 2 لـ ESPNET كقاعدة. هذا الريبو ينفذ فقط الإصدار النهائي من نموذج Lightspeech وليس البحث عن العمارة العصبية كما هو مذكور في الورق.

But I am able to compress only 3x (from 27 M to 7.99 M trainable parameters) not 15x .

متطلبات :

جميع الكود المكتوب في Python 3.6.2 .

تثبيت Pytorch

قبل تثبيت Pytorch ، يرجى التحقق من إصدار CUDA الخاص بك عن طريق تشغيل الأمر التالي: nvcc --version

 pip install torch torchvision

في هذا الريبو ، استخدمت Pytorch 1.6.0 لميزة torch.bucketize التي ليست موجودة في الإصدارات السابقة من Pytorch.

تثبيت المتطلبات الأخرى:

 pip install -r requirements.txt

لاستخدام Tensorboard تثبيت tensorboard version 1.14.0 seperatly مع tensorflow (1.14.0)

للمعالجة المسبقة:

يحتوي مجلد filelists على ملفات مجموعة بيانات MFA (MotReal Force) المعالجة LJSpeech بحيث لا تحتاج إلى محاذاة نص مع الصوت (لمدة الاستخراج) لمجموعة بيانات LJSPEEDE. لمجموعة البيانات الأخرى اتبع التعليمات هنا. للتشغيل المسبق للمعالجة المسبقة: الأمر التالي:

 python .nvidia_preprocessing.py -d path_of_wavs -c configs/default.yaml

للعثور على Min و Max من F0 والطاقة

 python .compute_statistics.py

قم بتحديث ما يلي في hparams.py بواسطة Min و Max من F0 والطاقة

 p_min = Min F0/pitch
p_max = Max F0
e_min = Min energy
e_max = Max energy

للتدريب

 python train_lightspeech.py --outdir etc -c configs/default.yaml -n "name"

للاستنتاج

WIP

 python .inference.py -c .configsdefault.yaml -p .checkpointsfirst_1xyz.pyt --out output --text "ModuleList can be indexed like a regular Python list but modules it contains are properly registered."

لتصدير Torchscript

 python export_torchscript.py -c configs/default.yaml -n fastspeech_scrip --outdir etc

ملحوظة :

لمزيد من الكاملة والنهاية إلى نهاية الاستنساخ الصوتي أو النص إلى صندوق الكلام (TTS)؟ يرجى زيارة تقنيات Deepsync.

مراجع

Lightspeech: نص خفيف وسريع إلى الكلام مع البحث عن العمارة العصبية
Fastspeech 2: النص السريع والعالي الجودة من طرف إلى طرف إلى الكلام
Fastspeech: نص سريع وقوي وقابل للتحكم في الكلام
ESPNET
تنفيذ WaveGlow Nvidia
ميليغان
دوريان
FASTSPEECH2 تنفيذ TENSORFLOW
تطبيق Pytorch Fastspeech 2 الآخر
ويفرن

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-14
الحجم 3.27MB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل