¡Soul App ha logrado recientemente un gran avance en el campo de "AI + social"! El editor de Downcodes se enteró de que Soul anunció oficialmente que su modelo de llamada de voz full-duplex de extremo a extremo de desarrollo propio se ha actualizado nuevamente, permitiendo conversaciones de voz naturales y fluidas con personas virtuales tan naturales y fluidas como las personas reales. Este movimiento marca un paso importante para Soul en la aplicación de la tecnología de inteligencia artificial, brindando a los usuarios una experiencia social más inmersiva e interactiva. Este artículo profundizará en las características únicas de este gran modelo y la exploración de Soul en el campo social de la IA.
En la pista nacional "AI + social", ¡Soul App está a punto de utilizar IA para inyectar nueva vitalidad!
Recientemente, Soul anunció oficialmente que su modelo de voz se ha actualizado nuevamente y se ha lanzado un modelo de llamada de voz full-duplex de extremo a extremo de desarrollo propio.
¡El efecto más sorprendente de esta actualización es que la llamada de voz entre el usuario y la persona virtual puede ser tan natural y fluida como charlar con una persona real!
¿Qué tan realista es el efecto? Primero puedes ver el video a continuación para tener una idea:
Un ejemplo oficial de "Experimente llamadas en tiempo real con IA"
Entonces, ¿qué tiene de especial el modelo de llamadas de voz de extremo a extremo desarrollado por Soul? Según la descripción oficial, sus aspectos más destacados incluyen:
Con latencia de interacción ultrabaja
Interrupción automática rápida
Expresión de voz súper realista.
Capacidad de percepción y comprensión emocional, etc.
La capacidad de retraso de interacción ultrabaja significa que en el momento en que usted habla, la IA puede responder inmediatamente sin demora, y la distancia entre usted y la IA se puede acortar en un instante. Si quieres tener una comunicación real con él, no necesitas esperar nada, es como hablar con una persona real.
El modelo de voz grande de Soul admite una interrupción automática rápida. En otras palabras, cuando te comunicas con la IA, si quieres interrumpir, ella puede entender completamente lo que quieres decir e interrumpir a la otra parte fácilmente. ¡Este tipo de interacción es realmente interesante!
Finalmente, junto con una expresión de voz ultrarrealista y capacidades de comprensión y percepción emocional , la IA no solo puede comprender sus palabras, sino también sentir sus emociones y dar respuestas apropiadas basadas en sus emociones.
Según el ejemplo del video oficial, si esta función se lanza por completo en el futuro, se estima que una gran cantidad de usuarios no podrán distinguir entre personas reales y personas virtuales con IA cuando la experimenten en Soul.
Soul dijo que su modelo grande de llamadas de voz de extremo a extremo se ha aplicado al escenario de llamadas en tiempo real "Echo of Another World" (bajo prueba interna) y se ampliará a múltiples escenarios de interacción y compañía de IA, como la IA. Gou Dan en el futuro.

Se entiende que ya en 2020, Soul lanzó la investigación y el desarrollo de tecnología AIGC, centrándose en la investigación y el desarrollo de tecnologías clave como el diálogo inteligente, la tecnología de voz y los humanos virtuales, e integrando profundamente estas capacidades de IA en escenarios sociales.
En el proceso de utilizar la IA para mejorar la interacción social, Soul presta especial atención a lograr una experiencia de compañía emocional natural y antropomórfica.
Para brindar una mejor retroalimentación emocional y compañía a los usuarios, el equipo técnico de Soul ha estado prestando atención a la comprensión emocional y los problemas de retraso. Han lanzado modelos de generación de voz, modelos de reconocimiento de voz, modelos de diálogo de voz, modelos de generación de música, etc. de desarrollo propio, que admiten generación de tonos reales, bricolaje de voz, cambio de varios idiomas, diálogo inmersivo multiemocional en tiempo real y otras funciones. Estos ya se han utilizado en múltiples escenarios de Soul, como "AI Goudan", interacción de voz de IA en tiempo real "Werewolf Phantom", "Echo from Another World", etc.
El modelo de llamada de voz de extremo a extremo desarrollado por Soul ahora está en línea, lo que significa que los usuarios pueden disfrutar de una experiencia de interacción humano-computadora más natural. En el futuro, Soul también planea promover aún más la construcción de capacidades de modelos grandes multimodales de extremo a extremo para hacer que la interacción entre las personas y la IA sea más interesante e inmersiva.
Esta vez, la actualización de la tecnología de inteligencia artificial de Soul no solo mejora la experiencia del usuario, sino que también proporciona nuevas ideas para la dirección de desarrollo futuro de "AI + social". Creo que en un futuro próximo veremos el surgimiento de aplicaciones sociales más innovadoras basadas en tecnología de inteligencia artificial, que traerán más diversión y comodidad a la vida social de las personas.