L'éditeur de Downcodes a appris que Westlake Xinchen avait annoncé qu'il ouvrirait le modèle Westlake-Omni qu'il a développé, qui est le premier modèle d'interaction vocale émotionnelle de bout en bout chinois open source au monde. Ce modèle utilise une représentation discrète pour unifier les modalités de texte et de parole, et accorde une attention particulière aux performances en temps réel, s'efforçant de fournir une expérience interactive à latence quasi nulle. Westlake-Omni a mené une formation approfondie sur des ensembles de données vocales émotionnelles chinoises de haute qualité, démontrant d'excellentes capacités de compréhension et d'expression émotionnelles. Il peut générer un discours chinois clair, naturel et expressif, offrant aux utilisateurs une expérience interactive plus humaine. Cela revêt une grande importance pour promouvoir le développement et l’application de la technologie chinoise d’interaction vocale émotionnelle.
Westlake Xinchen a annoncé qu'elle ouvrirait le modèle Westlake-Omni qu'elle a développé. En tant que premier modèle d'interaction vocale émotionnelle de bout en bout chinois open source au monde, Westlake-Omni utilise une représentation discrète pour unifier les modalités de texte et de parole, avec un accent particulier sur les performances en temps réel, permettant une réponse rapide et offrant une expérience de délai presque nul. .
Le modèle possède d’excellentes capacités de compréhension et d’expression émotionnelles et peut générer un discours chinois clair, naturel et expressif. Cette capacité bénéficie d’une formation approfondie sur des ensembles de données vocales émotionnelles chinoises de haute qualité, permettant au modèle non seulement de comprendre les émotions complexes dans le contexte chinois, mais également de rendre les interactions plus humaines.

Westlake Xinchen espère encourager davantage de développeurs à participer au développement de la technologie chinoise d'interaction vocale émotionnelle via le modèle open source Westlake-Omni, et promouvoir conjointement le développement et l'application de la technologie dans ce domaine.
Adresse du projet : https://github.com/xinchen-ai/Westlake-Omni
L'open source du modèle Westlake-Omni fournit aux développeurs de précieuses ressources d'apprentissage et de recherche, et injecte également une nouvelle vitalité dans le développement futur de la technologie chinoise d'interaction vocale émotionnelle. Dans l’attente de nouvelles applications innovantes basées sur Westlake-Omni !