XphoneBert_Vits2 Download - XphoneBert_Vits2 Source Code Download

XphoneBert_Vits2

كود الذكاء الاصطناعي

1.0.0

تنزيل

تم تمديد Vits2 مع Encoder XphoneBert

الاعتمادات

هذا الريبو بناءً على العمل الرائع لـ Vits2 Repo و XphoneBert.

المتطلبات الأساسية

بيثون> = 3.10
تم اختباره على إصدار Pytorch 1.13.1 مع Google Colab و Lambdalabs Cloud.
استنساخ هذا المستودع
تثبيت متطلبات بيثون. يرجى إحالة المتطلبات. txt
قم بتنزيل مجموعات البيانات
1. قم بتنزيل واستخراج مجموعة بيانات الكلام LJ ، ثم إعادة تسمية أو إنشاء رابط إلى مجلد DataSet: ln -s /path/to/LJSpeech-1.1/wavs DUMMY
2. ملاحظة: لا يدعم هذا الريبو التدريب على مجموعة بيانات متعددة المتحدثين
انقل/انسخ ملفات التدريب والتحقق من الصحة والتحقق من صحة إلى دليل FileLists ، ثم قم بتشغيل ملف preprocess.py (على غرار تشغيل مجموعة بيانات LJSpeech) ، على سبيل المثال: على سبيل المثال:
- يرجى الرجوع إلى XphoneBert لمزيد من المعلومات. يستخدمون text2phonemesequence لتحويل النص الخام إلى تسلسل phoneme.
- تهيئة text2phonemesequence لكل لغة يتطلب رمز ISO 639-3 المقابل. تتوفر رموز ISO 639-3 للغات المدعومة هنا.
- text2phonemesequence يأخذ تسلسلًا مكونًا من الكلمات كمدخل. وقد يقوم المستخدمون أيضًا بإجراء تطبيع النص على تسلسل تجزئة الكلمات قبل التغذية في text2phonemesequence .

ملاحظة: بالنسبة للغات مثل اللغة الصينية والكورية واليابانية (اللغات CJK) وبعض لغات جنوب شرق آسيا ، لا يتم فصل الكلمات عن طريق المسافات. يجب استخدام المميزات الخارجية قبل تغذية الكلمات في هذا النموذج. في هذه الحالة ، اكتب برنامج نصي لتطبيع وإدخال إدخالك قبل التغذية إلى text2phonemesequence (vie_preprocess.py في حالتي)

 # In Case languages, words are not separated by spaces such as Vietnamese.
python vie_preprocess.py --out_extension cleaned --filelists filelists/train.txt filelists/val.txt
python preprocess.py --input_file filelists/train.txt.cleaned --output_file filelists/train.list --language vie-n --batch_size 64 --cuda
python preprocess.py --input_file filelists/val.txt.cleaned --output_file filelists/val.list --language vie-n --batch_size 64 --cuda

# In Case languages English.
python preprocess.py --input_file filelists/train.txt.cleaned --output_file filelists/train.list --language eng-us --batch_size 64 --cuda
python preprocess.py --input_file filelists/val.txt.cleaned --output_file filelists/val.list --language eng-us --batch_size 64 --cuda

قم ببناء البحث في محاذاة رتيب وتشغيل المعالجة المسبقة إذا كنت تستخدم مجموعات البيانات الخاصة بك.

 # Cython-version Monotonoic Alignment Search
cd monotonic_align
python setup.py build_ext --inplace

مثال التدريب

مزيد من المعلومات حول config راجع configs/config.json

 # LJ Speech
python train.py -c configs/config.json -m ljs_base

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-08-22
الحجم 24.62MB
من Github

تطبيقات ذات صلة

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Dog_Fox_Bunny

2022-08-01
محرك تحليل البيانات Lihua الإصدار المجاني 3.0_search_navigation_collection_public Oplic_ranking_api

2022-06-28

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل