قائمة المستودعات ذات الصلة بحالات
لا يفهم المؤلف أي شيء عن التعلم الآلي وقد يحتوي هذا النص على العديد من الأخطاء. إذا كان الكود متاحًا للجمهور ، يجب إرفاق رابط GitHub. أنا متأكد من أن هناك العديد من المستودعات الرائعة غير المدرجة هنا. آسف لم يكن لدي وقت.
إبداعي
- jaywalnut310/vits: Vits: Autoencoder التباين الشرطي مع التعلم العدائي للتعلم من نص إلى طرف إلى طرف
معدل
softvc
يؤدي استبدال TextEncoder " VITS " مع ContentEncoder من HuBERT إلى التخلص من الحاجة إلى إدخال تسلسلات الصوت (أي القضاء على اعتماد اللغة). HuBERT هو جزء من SoftVC .
- innnky/so-its-svc: 基于 vits 与 softvc 的歌声音色转换模型
- QuickVC/Quickvc-voiceConversion: QuickVC: تحويل صوت أي شيء باستخدام تحويل فورييه العكسي لفترة قصيرة للتحويل بشكل أسرع
- Cjangcjengh/Moegoe: ملف قابل للتنفيذ لاستدلال Vits (SoftVC/W2V2)
- PlayVoice/VI-SVC: Vits Singing Voice Conversion استنادًا إلى PPG & Hubert ; Singing Voice Clone ؛
- Francis-Komizu/Sovits: تنفيذ مجموعة من VC Soft-VC و Vits تم إهمالها
- VTUBER-PLAN/VCVITS: تحويل صوت غير متوازي على أساس حركات
ISTFT (تحويل فورييه القصير العكسي)
تم تحسين الأداء من خلال تحسين وحدة فك الترميز ، والتي كانت عنق الزجاجة ، مع توليد متعدد الأطوار وتحويل فورييه القصيرة لفترة قصيرة.
- QuickVC/Quickvc-voiceConversion: QuickVC: تحويل صوت أي شيء باستخدام تحويل فورييه العكسي لفترة قصيرة للتحويل بشكل أسرع
- Masayakawamura/MB-طوائف الخوفان: خفيفة الوزن وعالي الدقة من نص إلى طرف إلى طرف مع جيل متعدد النطاقات وتحويل فورييه القصيرة القصيرة لفترة قصيرة
- HCY71O/MB-LESTFT-FITS-With-Autovocoder: دمج Autovocoder إلى MB-Coll-Vits
- [2206.00208] adavits: حالات صغيرة لتكييف مكبر الصوت المنخفض للحوسبة
تحسينات أخرى
- innnky/vispeech: 基于 vits fastspeech2 visinger 的 tts 模型
- CodeJin/Vits_Diffusion
- HCY71O/SC-Vits: نظام TTS الصفر القائم على الصفر الذي يتراوح مع طرق تكييف النمط/السماعات المتنوعة.
- innnky/its-its: 无需情感标注的情感可控语音合成模型 , 基于 基于
- Olawod/Freevc: Freevc: نحو تحويل صوت عالي الجودة خالية من النصوص
- edresson/yourtts: yourtts: نحو التحويل الصوتي متعدد الحواف الصدرية متعددة الحواس والتحويل الصوتي صفريًا للجميع الذي تم تطويره في وقت سابق.
لغات أخرى
- Francis-Komizu/Vits: ACG text-to-tpeech
- فرانسيس كوميزو/Vits-bilingual: نص إلى نص إلى خطاب صيني-ياباني.
- HCY71O/SC-Vits: نظام TTS الصفر القائم على الصفر الذي يتراوح مع طرق تكييف النمط/السماعات المتنوعة.
- RODTEN-WORK/VITS-MANDARIN-WODOWS: VITS for Mandarin. دعم Windows و Linux ، الصلبات المنخفضة والراقية
- Alexandajerry/Vits-Mandarin-Biaobei: تطبيق Vits على Mandarin TTS
- cjangcjengh/vits: Vits تنفيذ اليابانية والصينية والكورية والسنسكريتية والتايلاندية
- Isletennos/MMVC_Trainer: AI を使ったリアルタイムボイスチェンジャー (المدرب)
- [2211.09365] تخليق الكلام المنغولي منخفض الموارد على أساس شرح التلقائي التلقائي
- فتيت الفترة
أعادت إعادة تمهيد
نظرًا لأن إعادة النية تستغرق وقتًا ، فإن أحدث التقنيات لا يتم اعتمادها دائمًا في مستودعات الأطروحات. ومع ذلك ، ينبغي أن تكون هذه أسهل في الاستخدام.
- coqui-ai/tts :؟ -مجموعة أدوات تعليمية عميقة للنص إلى الكلام ، والاختصار في البحث والإنتاج
- ESPNET/ESPNET: مجموعة أدوات معالجة الكلام من طرف إلى طرف
آحرون
GUIS والنماذج المدربة مسبقًا
- Cjangcjengh/moegoe_gui: واجهة المستخدم الرسومية ل moegoe
- Francis-Komizu/Stellavoicechanger: تغيير الصوت القائم على التعلم العميق ، ويدعم الاستدلال المحلي.
- Luoyily /Moetts: نموذج توليف الكلام /الاستدلال واجهة المستخدم الرسومية لمجلة Galgame على أساس Tacotron2 ، Hifigan ، Vits و Diff-Svc
- thekog/gal-voice-bot
التكامل مع LLM
- paraworks/vits_with_chatgpt-gpt3
- minami-yuduru/-chatgpt_vits: 一个使用 Openai 接口链接 vits 模型的语音对话系统 واجهة المستخدم الرسومية
مقالات ، قوائم رهيبة ، أخبار
- voiceConversionLab (voiceConversion) / Twitter
- ZZW922CN/Awesome-Specte-Specte-Speenition-Speence-Synthesis-Papers: التعرف على الكلام التلقائي (ASR) ، والتحقق من المتحدثين ، وتوليف الكلام ، ونص من النص إلى الكلام (TTS) ، ونمذجة اللغة ، وتوليف الصوت الغناء (SVS) ، وتحويل الصوت (VC)
- البحث | مستودع طباعة Arxiv E.
- البحث | مستودع طباعة Arxiv E.
- "Vits" - Google Search
- البحث · حالات
- 【機械学習】 Vits でアニメ声へ変換できるボイスチェンジャー & 読み上げ器を作った話 - Qiita
- 2021 年 6 月に発表された最新の音声合成手法「 Vits 」でアニメ風合成音声を作ってみた【つくよみちゃんコーパス】