Редактор Downcodes узнал, что Westlake Xinchen объявила, что откроет исходный код разработанной ею модели Westlake-Omni, которая является первой в мире китайской моделью сквозного эмоционального голосового взаимодействия с открытым исходным кодом. Эта модель использует дискретное представление для унификации текстовых и речевых модальностей и уделяет особое внимание производительности в реальном времени, стремясь обеспечить интерактивный опыт практически с нулевой задержкой. Компания Westlake-Omni провела углубленное обучение на высококачественных наборах данных об эмоциональной речи на китайском языке, продемонстрировав превосходные способности к эмоциональному пониманию и выражению. Он может генерировать четкую, естественную и выразительную китайскую речь, предоставляя пользователям более гуманный интерактивный опыт. Это имеет большое значение для содействия развитию и применению китайской технологии эмоционального голосового взаимодействия.
Westlake Xinchen объявила, что откроет исходный код разработанной ею модели Westlake-Omni. Будучи первой в мире китайской моделью сквозного речевого взаимодействия с открытым исходным кодом, Westlake-Omni использует дискретное представление для унификации текстовых и речевых модальностей, уделяя особое внимание производительности в реальном времени, обеспечивая быстрое реагирование и практически нулевую задержку. .
Модель обладает отличными способностями к пониманию и выражению эмоций и может генерировать четкую, естественную и выразительную китайскую речь. Эта способность выигрывает от углубленного обучения на высококачественных наборах данных об эмоциональной речи на китайском языке, что позволяет модели не только понимать сложные эмоции в китайском контексте, но и делать взаимодействие более гуманным.

Westlake Xinchen надеется привлечь больше разработчиков к участию в разработке китайской технологии эмоционального голосового взаимодействия с помощью модели Westlake-Omni с открытым исходным кодом, а также совместно продвигать разработку и применение технологий в этой области.
Адрес проекта: https://github.com/xinchen-ai/Westlake-Omni
Открытый исходный код модели Westlake-Omni предоставляет разработчикам ценные ресурсы для обучения и исследований, а также придаёт новую жизнь будущему развитию китайской технологии эмоционального голосового взаимодействия. С нетерпением ждем новых инновационных приложений на базе Westlake-Omni!