Editor Downcodes mengetahui bahwa Westlake Xinchen mengumumkan bahwa mereka akan menjadi open source model Westlake-Omni yang dikembangkannya, yang merupakan model interaksi suara end-to-end emosional China open source pertama di dunia. Model ini menggunakan representasi diskrit untuk menyatukan modalitas teks dan ucapan, dan memberikan perhatian khusus pada kinerja real-time, berupaya memberikan pengalaman interaktif yang hampir tanpa latensi. Westlake-Omni telah melakukan pelatihan mendalam tentang kumpulan data ucapan emosional berbahasa Mandarin berkualitas tinggi, yang menunjukkan kemampuan pemahaman dan ekspresi emosional yang sangat baik. Hal ini dapat menghasilkan ucapan bahasa Mandarin yang jelas, alami, dan ekspresif, sehingga memberikan pengalaman interaktif yang lebih manusiawi kepada pengguna. Hal ini sangat penting untuk mempromosikan pengembangan dan penerapan teknologi interaksi suara emosional Tiongkok.
Westlake Xinchen mengumumkan bahwa mereka akan menjadi open source model Westlake-Omni yang dikembangkannya. Sebagai model interaksi ucapan emosional end-to-end Tiongkok open source pertama di dunia, Westlake-Omni menggunakan representasi terpisah untuk menyatukan modalitas teks dan ucapan, dengan penekanan khusus pada kinerja real-time, memungkinkan respons cepat dan memberikan pengalaman hampir tanpa penundaan. .
Model ini memiliki kemampuan pemahaman dan ekspresi emosional yang sangat baik serta dapat menghasilkan ucapan bahasa Mandarin yang jelas, alami, dan ekspresif. Kemampuan ini mendapat manfaat dari pelatihan mendalam mengenai kumpulan data ucapan emosional Tiongkok berkualitas tinggi, sehingga model ini tidak hanya memahami emosi kompleks dalam konteks Tiongkok, tetapi juga membuat interaksi menjadi lebih manusiawi.

Westlake Xinchen berharap dapat mendorong lebih banyak pengembang untuk berpartisipasi dalam pengembangan teknologi interaksi suara emosional Tiongkok melalui model open source Westlake-Omni, dan bersama-sama mempromosikan pengembangan dan penerapan teknologi di bidang ini.
Alamat proyek: https://github.com/xinchen-ai/Westlake-Omni
Sumber terbuka model Westlake-Omni memberi pengembang sumber daya pembelajaran dan penelitian yang berharga, dan juga memberikan vitalitas baru ke dalam pengembangan masa depan teknologi interaksi suara emosional Tiongkok. Menantikan aplikasi yang lebih inovatif berdasarkan Westlake-Omni!