Официальный веб-сайт www.binance.com/zh-cn :введите официальный веб-сайт ☜☜
Приложение: ☞☞official App Download☜☜
19 марта была официально представлена модель с открытым исходным кодом (TTS) под названием Orpheus TTS. Эта модель быстро привлекла внимание благодаря его эмоциональному выражению человека, естественным и гладким голосовым эффектам и ультра-низкой задержкой в реальном времени характеристик выходного потока. Сообщается, что Orpheus TTS хорошо работает в сценариях диалога в реальном времени и, как ожидается, принесет новые прорывы для интеллектуального голосового взаимодействия.
Orpheus tts фокусируется на низкой латентности и высокой эмоциональной экспрессии. Его основные функции включают в себя: ультра-низкую задержку, с задержкой по умолчанию около 200 миллисекунд. Благодаря оптимизации кэша KV входного потока и модели задержка может быть сжата до 25-50 миллисекунд для удовлетворения потребностей разговоров в реальном времени; Эмоциональное выражение и голосовая продукция являются естественными и гладкими, которые могут быть близки к человеческим эмоциям, поддерживать богатые изменения интонации и улучшать интерактивный опыт; Выходные потоки в режиме реального времени поддерживают генерацию потокового звука для обеспечения синхронизации голоса и ввода, и подходят для сценариев, таких как виртуальные помощники, системы обслуживания клиентов.
Благодаря своей низкой задержке и высокой характеристиках естественности, считается, что Orpheus TTS обладает широким потенциалом в области беседы в реальном времени. Будь то умный голосовой помощник, онлайн -образование или дублирование виртуальных якорей и игровых персонажей, эта модель может обеспечить более гуманный опыт взаимодействия голоса. Кроме того, его природа с открытым исходным кодом также предоставляет разработчикам больше возможностей настройки.
Благодаря сочетанию эмоционального выражения, естественных эффектов и сверхнизкой латентности Orpheus TTS отмечает новый рост для технологии TTS. Это не только улучшает качество синтеза речи, но и открывает новую ситуацию для динамических интерактивных сценариев с помощью выходных потоков в реальном времени. В будущем эта модель может стать эталоном в области TTS с открытым исходным кодом.
Адрес: https://github.com/canopyai/orpheus-tts