
Papier | Webseite
Wie wir in unserer Zeitung und unserer Website beschrieben haben, sind die Vorteile von OpenVoice dreifach:
1. Genauige Tonfarbe klonieren. OpenVoice kann die Referenztonfarbe genau klonen und Sprache in mehreren Sprachen und Akzenten erzeugen.
2. Flexible Sprachstilregelung. OpenVoice ermöglicht eine granulare Kontrolle über Sprachstile wie Emotionen und Akzent sowie andere Stilparameter, einschließlich Rhythmus, Pausen und Intonation.
3. Klonend. Weder die Sprache der erzeugten Sprache noch die Sprache der Referenzrede müssen im massiven multi-lingualen Trainingsdatensatz dargestellt werden.
Im April 2024 haben wir OpenVoice V2 veröffentlicht, das alle Funktionen in V1 enthält und:
1. Bessere Audioqualität. OpenVoice V2 verfolgt eine andere Schulungsstrategie, die eine bessere Audioqualität liefert.
2. Native Multi-Lingual-Unterstützung. Englisch, Spanisch, Französisch, Chinesisch, Japanisch und Koreanisch werden in OpenVoice V2 nativ unterstützt.
3. Kostenloser kommerzieller Gebrauch. Ab April 2024 werden sowohl V2 als auch V1 unter MIT -Lizenz veröffentlicht. Kostenlos für den kommerziellen Gebrauch.
OpenVoice hat seit Mai 2023 die sofortige Sprachklonierungsfunktion von MyShell.ai betrieben. Bis November 2023 wurde das Sprachklonierungsmodell von den Nutzern weltweit zehn zehn Male verwendet und das explosive Benutzerwachstum auf der Plattform erlebt.
Weitere Informationen finden Sie in der Verwendung für detaillierte Anweisungen.
Weitere Fragen und Antworten finden Sie in der QA. Wir werden die Frage- und Antwortliste regelmäßig aktualisieren.
@article{qin2023openvoice,
title={OpenVoice: Versatile Instant Voice Cloning},
author={Qin, Zengyi and Zhao, Wenliang and Yu, Xumin and Sun, Xin},
journal={arXiv preprint arXiv:2312.01479},
year={2023}
}
OpenVoice V1 und V2 sind MIT lizenziert. Kostenlos für die Verwendung von Handels- und Forschungsnutzung.
Diese Implementierung basiert auf mehreren hervorragenden Projekten, TTs, Vits und Vits2. Danke für ihre großartige Arbeit!