علم محرر Downcodes أن Westlake Xinchen أعلنت أنها ستفتح المصدر لنموذج Westlake-Omni الذي طورته، وهو أول نموذج تفاعل صوتي عاطفي صيني مفتوح المصدر في العالم. يستخدم هذا النموذج تمثيلًا منفصلاً لتوحيد أنماط النص والكلام، ويولي اهتمامًا خاصًا للأداء في الوقت الفعلي، ويسعى جاهداً لتوفير تجربة تفاعلية خالية من الكمون تقريبًا. أجرت Westlake-Omni تدريبًا متعمقًا على مجموعات بيانات الكلام العاطفي الصينية عالية الجودة، مما يُظهر فهمًا عاطفيًا ممتازًا وقدرات تعبيرية، ويمكنها توليد خطاب صيني واضح وطبيعي ومعبر، مما يوفر للمستخدمين تجربة تفاعلية أكثر إنسانية. وهذا له أهمية كبيرة لتعزيز تطوير وتطبيق تكنولوجيا التفاعل الصوتي العاطفي الصينية.
أعلنت Westlake Xinchen أنها ستفتح المصدر لنموذج Westlake-Omni الذي طورته. باعتباره أول نموذج تفاعلي للكلام العاطفي الصيني مفتوح المصدر في العالم، يستخدم Westlake-Omni التمثيل المنفصل لتوحيد طرائق النص والكلام، مع التركيز بشكل خاص على الأداء في الوقت الفعلي، مما يتيح الاستجابة السريعة وتوفير تجربة تأخير صفر تقريبًا .
يتمتع النموذج بقدرات ممتازة على الفهم العاطفي والتعبير ويمكنه توليد خطاب صيني واضح وطبيعي ومعبر. تستفيد هذه القدرة من التدريب المتعمق على مجموعات بيانات الكلام العاطفي الصينية عالية الجودة، مما يسمح للنموذج ليس فقط بفهم المشاعر المعقدة في السياق الصيني، ولكن أيضًا جعل التفاعلات أكثر إنسانية.

وتأمل Westlake Xinchen في تشجيع المزيد من المطورين على المشاركة في تطوير تكنولوجيا التفاعل الصوتي العاطفي الصينية من خلال نموذج Westlake-Omni مفتوح المصدر، والعمل بشكل مشترك على تعزيز تطوير وتطبيق التكنولوجيا في هذا المجال.
عنوان المشروع: https://github.com/xinchen-ai/Westlake-Omni
يوفر المصدر المفتوح لنموذج Westlake-Omni للمطورين موارد تعليمية وبحثية قيمة، كما يضخ حيوية جديدة في التطوير المستقبلي لتكنولوجيا التفاعل الصوتي العاطفي الصينية. نتطلع إلى المزيد من التطبيقات المبتكرة بناءً على Westlake-Omni!