Xihu Xinchen a récemment publié le premier modèle vocal de bout en bout à grande échelle de Chine, Xinchen Lingo, et a ouvert des rendez-vous bêta internes. Ce modèle est considéré comme le premier système d'IA en Chine doté de capacités vocales comparables à GPT-4, marquant les progrès significatifs de la Chine dans le domaine de l'IA vocale. Ses principaux avantages résident dans la compréhension native de la parole, l'expression diversifiée des styles de parole et la compression modale de la parole efficace, qui peuvent offrir une expérience d'interaction vocale plus naturelle et plus fluide et réduire considérablement les coûts de calcul et de stockage. Il ne s’agit pas seulement d’une avancée technologique, mais cela ouvre également de larges perspectives pour les applications d’IA vocale.
Xihu Xinchen a récemment lancé Xinchen Lingo, le premier modèle vocal de bout en bout à grande échelle en Chine, et a ouvert des rendez-vous bêta internes. Ce modèle innovant est salué comme le premier système d'IA national doté des mêmes capacités vocales que le GPT-4, marquant une avancée majeure de la Chine dans le domaine de l'IA vocale.
Il est rapporté que le grand modèle vocal de Xinchen Lingo présente trois avantages principaux : la compréhension native de la parole, l'expression diversifiée du style de parole et une compression modale vocale efficace. Ce modèle peut non seulement reconnaître les informations textuelles contenues dans la parole, mais également capturer d'autres caractéristiques importantes pour offrir une expérience interactive plus naturelle et plus vivante.

Dans le même temps, Lingo peut ajuster de manière flexible le style de voix en fonction du contexte et des instructions de l'utilisateur pour s'adapter à différents scénarios d'application. Au niveau technique, Xinchen Lingo utilise un codec vocal à taux de compression élevé pour réduire considérablement les coûts de calcul et de stockage tout en garantissant la génération d'un contenu vocal de haute qualité. Par rapport aux systèmes de synthèse vocale (TTS) traditionnels, Xinchen Lingo, en tant que modèle vocal de bout en bout, intègre le processus d'interaction complet, de la saisie vocale au retour vocal, offrant aux utilisateurs une expérience d'interaction vocale plus complète et plus fluide.
Les experts du secteur estiment que le lancement de Xinchen Lingo apportera de nouvelles possibilités pour les applications d'IA vocale et devrait jouer un rôle important dans les assistants intelligents, l'interaction vocale, l'éducation et la formation, ainsi que dans d'autres domaines. À mesure que les tests internes progressent, le marché est plein d'attentes quant aux performances réelles de cette technologie innovante et s'attend à ce qu'elle apporte des changements révolutionnaires dans le domaine de l'interaction vocale de l'IA.
Adresse de l'application de test interne :
https://lingo.xinchenai.com/
L’émergence de Xinchen Lingo démontre non seulement la force technique de la Chine dans le domaine de l’intelligence artificielle, mais ouvre également la voie au développement futur de la technologie d’interaction vocale intelligente. Nous attendons avec impatience qu'il démontre des capacités plus puissantes lors des tests internes et offre aux utilisateurs une expérience d'interaction vocale plus pratique et plus intelligente.