O editor do Downcodes soube que Westlake Xinchen anunciou que abrirá o código-fonte do modelo Westlake-Omni que desenvolveu, que é o primeiro modelo de interação de voz emocional de ponta a ponta chinês de código aberto do mundo. Este modelo usa representação discreta para unificar as modalidades de texto e fala e dá atenção especial ao desempenho em tempo real, buscando fornecer uma experiência interativa com latência quase zero. Westlake-Omni conduziu treinamento aprofundado em conjuntos de dados de fala emocional chinesa de alta qualidade, mostrando excelentes capacidades de compreensão e expressão emocional. Ele pode gerar uma fala chinesa clara, natural e expressiva, proporcionando aos usuários uma experiência interativa mais humana. Isto é de grande importância para promover o desenvolvimento e aplicação da tecnologia chinesa de interação por voz emocional.
Westlake Xinchen anunciou que abrirá o código do modelo Westlake-Omni que desenvolveu. Como o primeiro modelo chinês de interação de fala emocional de ponta a ponta de código aberto do mundo, o Westlake-Omni usa representação discreta para unificar modalidades de texto e fala, com ênfase especial no desempenho em tempo real, permitindo resposta rápida e proporcionando uma experiência de atraso quase zero .
O modelo possui excelentes capacidades de compreensão e expressão emocional e pode gerar uma fala chinesa clara, natural e expressiva. Esta capacidade beneficia da sua formação aprofundada em conjuntos de dados de fala emocional chinesa de alta qualidade, permitindo ao modelo não só compreender emoções complexas no contexto chinês, mas também tornar as interações mais humanas.

Westlake Xinchen espera encorajar mais desenvolvedores a participarem do desenvolvimento da tecnologia chinesa de interação de voz emocional por meio do modelo Westlake-Omni de código aberto e promover conjuntamente o desenvolvimento e a aplicação de tecnologia neste campo.
Endereço do projeto: https://github.com/xinchen-ai/Westlake-Omni
O código aberto do modelo Westlake-Omni fornece aos desenvolvedores valiosos recursos de aprendizagem e pesquisa, e também injeta nova vitalidade no desenvolvimento futuro da tecnologia chinesa de interação por voz emocional. Ansiosos por aplicações mais inovadoras baseadas em Westlake-Omni!