Soul App fez recentemente um grande avanço no campo de "AI + social"! O editor do Downcodes soube que o Soul anunciou oficialmente que seu modelo de chamada de voz full-duplex desenvolvido por ele mesmo foi atualizado novamente, permitindo conversas de voz naturais e suaves com pessoas virtuais tão naturais e suaves quanto pessoas reais. Esta mudança marca um passo importante para a Soul na aplicação da tecnologia de IA, trazendo aos usuários uma experiência social mais imersiva e interativa. Este artigo irá se aprofundar nos recursos exclusivos deste grande modelo e na exploração do Soul no campo social da IA.
Na faixa doméstica "AI + social", Soul App está prestes a usar IA para injetar nova vitalidade!
Recentemente, a Soul anunciou oficialmente que seu modelo de voz foi atualizado novamente e um modelo de chamada de voz full-duplex autodesenvolvido foi lançado.
O efeito mais surpreendente desta atualização é que a chamada de voz entre o usuário e a pessoa virtual pode ser tão natural e suave quanto conversar com uma pessoa real!
Quão realista é o efeito? Você pode primeiro assistir ao vídeo abaixo para ter uma ideia:
Um exemplo oficial de "Experimente chamadas em tempo real com IA"
Então, o que há de tão especial no modelo de chamada de voz ponta a ponta desenvolvido pela Soul? De acordo com a descrição oficial, seus maiores destaques incluem:
Com latência de interação ultrabaixa
Interrupção automática rápida
Expressão de voz super realista
Percepção emocional e capacidade de compreensão, etc.
A capacidade de atraso de interação ultrabaixo significa que, no momento em que você fala, a IA pode responder imediatamente, sem qualquer atraso, e a distância entre você e a IA pode ser reduzida em um instante. Se você quiser ter uma comunicação real com ele, não precisa esperar nada, é como conversar com uma pessoa real.
O grande modelo de voz do Soul suporta interrupção automática rápida. Em outras palavras, quando você está se comunicando com a IA, se quiser interromper, ela pode entender completamente o que você quer dizer e interromper facilmente a outra parte. Esse tipo de interação é realmente interessante!
Finalmente, juntamente com a expressão de voz ultra-realista e as capacidades de percepção e compreensão emocional , a IA pode não apenas entender suas palavras, mas também sentir suas emoções e dar respostas apropriadas com base em suas emoções.
Com base no exemplo do vídeo oficial, se esse recurso for totalmente lançado no futuro, estima-se que um grande número de usuários poderá não ser capaz de distinguir entre pessoas reais e pessoas virtuais de IA quando o experimentarem no Soul.
Soul disse que seu grande modelo de chamada de voz ponta a ponta foi aplicado ao cenário de chamada em tempo real "Echo of Another World" (em testes internos) e será expandido para vários cenários de companhia de IA e interação de IA, como AI Gou Dan no futuro.

Entende-se que já em 2020, a Soul lançou pesquisa e desenvolvimento de tecnologia AIGC, concentrando-se na pesquisa e desenvolvimento de tecnologias-chave, como diálogo inteligente, tecnologia de voz e humanos virtuais, e integrando profundamente essas capacidades de IA em cenários sociais.
No processo de usar IA para melhorar a interação social, Soul presta atenção especial para alcançar uma experiência de companheirismo emocional antropomórfica e natural.
Para trazer melhor feedback emocional e companheirismo aos usuários, a equipe técnica do Soul tem se atento à compreensão emocional e às questões de atraso. Eles lançaram modelos de geração de fala autodesenvolvidos, modelos de reconhecimento de fala, modelos de diálogo de voz, modelos de geração de música, etc., que suportam geração de tom real, voz DIY, comutação multilíngue, diálogo multiemocional imersivo em tempo real e outras funções Estes já foram usados em vários cenários de Soul, como "AI Goudan", "Werewolf Phantom", interação de voz AI em tempo real, "Echo from Another World", etc.
O modelo de chamada de voz ponta a ponta desenvolvido pela Soul agora está online, o que significa que os usuários podem desfrutar de uma experiência de interação humano-computador mais natural. No futuro, a Soul também planeja promover ainda mais a construção de grandes capacidades multimodais de ponta a ponta para tornar a interação entre pessoas e IA mais interessante e envolvente.
A atualização da tecnologia de IA da Soul desta vez não apenas melhora a experiência do usuário, mas também fornece novas ideias para a direção de desenvolvimento futuro de “AI + social”. Acredito que num futuro próximo veremos o surgimento de aplicações sociais mais inovadoras baseadas na tecnologia de IA, trazendo mais diversão e comodidade à vida social das pessoas.