
종이 | 웹 사이트
논문과 웹 사이트에서 자세히 설명 하듯이 OpenVoice의 장점은 세 가지입니다.
1. 정확한 톤 컬러 클로닝. OpenVoice는 참조 톤 색상을 정확하게 복제하고 여러 언어와 악센트로 음성을 생성 할 수 있습니다.
2. 유연한 음성 스타일 컨트롤. OpenVoice는 감정 및 악센트와 같은 음성 스타일뿐만 아니라 리듬, 일시 정지 및 억양을 포함한 다른 스타일 매개 변수를 세분화 할 수 있습니다.
3. 제로 샷 교차 목소리 복제. 생성 된 연설의 언어 나 참조 언어의 언어는 대규모 스피커 다국어 교육 데이터 세트에 제시 될 필요가 없습니다.
2024 년 4 월, V1의 모든 기능을 포함하는 OpenVoice V2를 발표했습니다.
1. 더 나은 오디오 품질. OpenVoice V2는 더 나은 오디오 품질을 제공하는 다른 교육 전략을 채택합니다.
2. 원주민 다국어 지원. 영어, 스페인어, 프랑스어, 중국어, 일본어 및 한국은 OpenVoice V2에서 기본적으로 지원됩니다.
3. 무료 상업용. 2024 년 4 월부터 V2와 V1은 MIT 라이센스에 따라 출시됩니다. 상업용 용도로 무료.
OpenVoice는 2023 년 5 월부터 Myshell.ai의 즉각적인 음성 복제 기능을 강화해 왔습니다. 2023 년 11 월까지 음성 복제 모델은 전 세계 사용자가 수천 번 사용했으며 플랫폼에서 폭발적인 사용자 성장을 목격했습니다.
자세한 지침은 사용법을 참조하십시오.
일반적인 질문과 답변은 QA를 참조하십시오. 우리는 정기적으로 질문 및 답변 목록을 업데이트 할 것입니다.
@article{qin2023openvoice,
title={OpenVoice: Versatile Instant Voice Cloning},
author={Qin, Zengyi and Zhao, Wenliang and Yu, Xumin and Sun, Xin},
journal={arXiv preprint arXiv:2312.01479},
year={2023}
}
OpenVoice V1 및 V2는 MIT 라이센스가 부여되었습니다. 상업 및 연구 용도 모두 무료.
이 구현은 몇 가지 우수한 프로젝트, TTS, VITS 및 VITS2를 기반으로합니다. 그들의 멋진 작품에 감사드립니다!