
Бумага | Веб -сайт
Как мы подробно описываем на нашу статью и веб-сайт, преимущества OpenVoice трижды:
1. Точный цвет тона. Клонирование. OpenVoice может точно клонировать опорный цвет тона и генерировать речь на нескольких языках и акцентах.
2. Гибкий контроль в стиле голоса. OpenVoice обеспечивает детальный контроль над стилями голоса, такими как эмоции и акцент, а также другие параметры стиля, включая ритм, паузы и интонацию.
3. Ноль-выстрел поперечного голоса клонирования. Ни язык сгенерированной речи, ни язык эталонной речи не должны быть представлены в многоязычном наборе учебного набора с массовым напитком.
В апреле 2024 года мы выпустили OpenVoice V2, который включает все функции в V1 и имеет:
1. Лучшее качество звука. OpenVoice V2 принимает другую стратегию обучения, которая обеспечивает лучшее качество звука.
2. Нативная многоязычная поддержка. Английский, испанский, французский, китайский, японский и корейский и корейский язык национально поддерживаются в OpenVoice V2.
3. Бесплатное коммерческое использование. Начиная с апреля 2024 года, как V2, так и V1 выпускаются по лицензии MIT. Бесплатно для коммерческого использования.
OpenVoice обеспечивает мгновенную способность клонирования голоса MyShell.ai с мая 2023 года. До ноября 2023 года модель голосового клонирования использовалась в течение десятков миллионов раз пользователями по всему миру и была свидетелем роста взрывного пользователя на платформе.
Пожалуйста, смотрите при использовании подробных инструкций.
Пожалуйста, смотрите QA для общих вопросов и ответов. Мы будем регулярно обновлять список вопросов и ответов.
@article{qin2023openvoice,
title={OpenVoice: Versatile Instant Voice Cloning},
author={Qin, Zengyi and Zhao, Wenliang and Yu, Xumin and Sun, Xin},
journal={arXiv preprint arXiv:2312.01479},
year={2023}
}
OpenVoice V1 и V2 лицензированы MIT. Бесплатно как для коммерческого, так и для исследования.
Эта реализация основана на нескольких отличных проектах, TTS, VIT и VITS2. Спасибо за их потрясающую работу!