Список репозиторий, имеющих отношение к VIT
Автор ничего не понимает о машинном обучении, и этот текст может содержать много ошибок. Если код общедоступен, ссылка GitHub должна быть прикреплена. Я уверен, что здесь есть еще много отличных репозиториев. Извините, у меня не было времени.
Оригинал
- jaywalnut310/vits: vits: условное вариационное автоэкодер с состязательным обучением для сквозного текста в речь
Модифицированный
Softvc
Замена VITS ' TextEncoder на ContentEncoder HuBERT устраняет необходимость ввода последовательностей фонем (то есть устранить языковую зависимость). HuBERT является частью SoftVC .
- innnky/so-vits-svc: 基于 vits 与 softvc 的歌声音色转换模型
- QuickVC/QuickVC-VoiceConversion: QuickVC: преобразование голоса любого ко многим с использованием обратного кратковременного преобразования Фурье для более быстрого преобразования
- Cjangcjengh/Moegoe: исполняемый файл для вывода VITS (SoftVC/W2V2)
- Playvoice/Vi-SVC: Vits Singing Voice Oversion на основе PPG & Hubert ; Conting Voice Clone;
- Фрэнсис-Комизу/Совиты: реализация комбинации мягкого VC и VIT.
- Vtuber-Plan/VCVIT: не параллельное преобразование голоса на основе VIT
ISTFT (обратное кратковременное преобразование Фурье)
Производительность улучшается за счет улучшения декодера, который был узким местом, с многополосным генерацией и обратным коротким преобразованием Фурье.
- QuickVC/QuickVC-VoiceConversion: QuickVC: преобразование голоса любого ко многим с использованием обратного кратковременного преобразования Фурье для более быстрого преобразования
- Masayakawamura/MB-ISTFT-Vits: легкий и высокий уровень сквозного текста в речь с многополосной генерацией и обратным коротким преобразованием Фурье Фурье
- HCY71O/MB-ISTFT-VITS-WITH-Autovocoder: включение Autovocoder в MB-ISTFT-Vits
- [2206.00208] Адавиты: крошечные Vit для адаптации динамика с низким вычислительным ресурсом
Другие улучшения
- Innnky/vispeech: 基于 vits fastspeech2 visinger 的 tts 模型 模型
- CodeJin/vits_diffusion
- HCY71O/SC-VITS: система с нулевым выстрелом на основе VITS варьируется в зависимости от различных методов кондиционирования стиля/динамиков.
- Innnky/Emotional-Vits: 无需情感标注的情感可控语音合成模型 基于 基于 Vits
- Olawod/freevc: freevc: на пути к высококачественному конверсию голоса без текста.
- Edresson/yourtts: yourtts: на пути к многопрофильным TTS с нулевым выстрелом и преобразование голоса с нулевым выстрелом для всех с нулевым выстрелом, которое развивалось ранее.
Другие языки
- Фрэнсис-Комизу/Виты: ACG Текст-речь
- Фрэнсис-Комизу/Витс-Бинглингвис: китайский японский двуязычный текст в речь
- HCY71O/SC-VITS: система с нулевым выстрелом на основе VITS варьируется в зависимости от различных методов кондиционирования стиля/динамиков.
- гнилые рабочие/Vits-Mandarin-Windows: Vits for Mandarin. Поддержите Windows и Linux, низкокачественные и высококачественные жесткие проходы
- Alexandajerry/vits-mandarin-biaobei: применение VIT на мандаринских TTS
- Cjangcjengh/Vits: VITS реализация японских, китайских, корейских, санскрита и тайского
- isledennos/mmvc_trainer: ai を使ったリアルタイムボイスチェンジャー (тренер)
- [2211.09365] Синтез монгольского речи с низким ресурсом на основе автоматической аннотации просодии
- Период Vits
Рефактован
Поскольку рефакторинг требует времени, последние технологии не всегда используются в репозиториях. Тем не менее, это должно быть сделано проще в использовании.
- Coqui-AI/TTS:? -Трудные инструментарии для глубокого обучения для текста в речь, испытанный в исследованиях и производстве
- ESPNet/ESPNet: инструментарий для обработки речевой речи
Другие
GUI и предварительно обученные модели
- Cjangcjengh/moegoe_gui: графический интерфейс для Moegoe
- Фрэнсис-Комизу/StellavoiceChanger: глубоко уборщик, поддерживающий локальный вывод.
- Luoyily /Moetts: модель синтеза речи /выводы Gui Repo для символов Galgame на основе такотрон2, Hifigan, VIT и Diff-SVC
- Thekog/Gal-Voice-Bot
Интеграция с LLM
- Paraworks/vits_with_chatgpt-gpt3
- Minami-Yuduru/-chatgpt_vits: 一个使用 Openai 接口链接 Vits 模型的语音对话系统 Gui
Статьи, потрясающие списки, новости
- Voiceconversionlab (@voiceconversion) / Twitter
- ZZW922CN/Awesome-Speek-Coctenition-Speech-Synthesis-Papers: автоматическое распознавание речи (ASR), проверка динамиков, синтез речи, текст в речь (TTS), языковое моделирование, синтез по пению голоса (SVS), преобразование голоса (VC)
- Поиск | Arxiv E-Print Repository
- Поиск | Arxiv E-Print Repository
- "Vits" - поиск Google
- Поиск · Vits
- 【機械学習】 Vits でアニメ声へ変換できるボイスチェンジャー & 読み上げ器を作った話 - Qiita
- 2021 年 6 月に発表された最新の音声合成手法「 Vits 」でアニメ風合成音声を作ってみた【つくよみちゃんコーパス】