
ورقة | موقع إلكتروني
كما تم تفصيلنا في الورق والموقع الخاص بنا ، فإن مزايا OpenVoice ثلاث أضعاف:
1. دقة نغمة اللون استنساخ. يمكن لـ OpenVoice استنساخ لون النغمة المرجعية بدقة وتوليد الكلام بلغات ولكنات متعددة.
2. التحكم في نمط الصوت المرن. يتيح OpenVoice التحكم الحبيبي على أنماط الصوت ، مثل العاطفة واللكنة ، بالإضافة إلى معلمات نمط أخرى بما في ذلك الإيقاع ، والتوقف ، والتجويد.
3. لا يجب تقديم أي من لغة الكلام الناتج أو لغة الكلام المرجعي في مجموعة بيانات التدريب المتعددة اللغات الضخمة.
في أبريل 2024 ، أصدرنا OpenVoice V2 ، والذي يتضمن جميع الميزات في V1 ولديه:
1. جودة صوت أفضل. يعتمد OpenVoice V2 استراتيجية تدريب مختلفة توفر جودة صوت أفضل.
2. الدعم الأصلي متعدد اللغات. يتم دعم اللغة الإنجليزية والإسبانية والفرنسية والصينية واليابانية والكورية أصلاً في OpenVoice V2.
3. الاستخدام التجاري المجاني. ابتداءً من أبريل 2024 ، يتم إصدار كلا من V2 و V1 بموجب ترخيص MIT. مجاني للاستخدام التجاري.
يعمل OpenVoice على تشغيل قدرة الاستنساخ الفوري لـ MyShell.ai منذ مايو 2023. حتى نوفمبر 2023 ، تم استخدام نموذج الاستنساخ الصوتي عشرات من المرات من قبل المستخدمين في جميع أنحاء العالم ، وشهد نمو المستخدم المتفجر على المنصة.
يرجى الاطلاع على الاستخدام للحصول على تعليمات مفصلة.
يرجى الاطلاع على ضمان الجودة للحصول على الأسئلة والأجوبة الشائعة. سنقوم بانتظام بتحديث قائمة الأسئلة والإجابة.
@article{qin2023openvoice,
title={OpenVoice: Versatile Instant Voice Cloning},
author={Qin, Zengyi and Zhao, Wenliang and Yu, Xumin and Sun, Xin},
journal={arXiv preprint arXiv:2312.01479},
year={2023}
}
OpenVoice V1 و V2 مرخصان معهد ماساتشوستس للتكنولوجيا. مجاني للاستخدام التجاري والبحث.
يعتمد هذا التنفيذ على العديد من المشاريع الممتازة ، TTS ، Vits ، و Vits2. شكرا لعملهم الرائع!