Soul App เพิ่งสร้างความก้าวหน้าครั้งสำคัญในด้าน "AI + โซเชียล"! บรรณาธิการของ Downcodes ได้เรียนรู้ว่า Soul ได้ประกาศอย่างเป็นทางการว่ารูปแบบการโทรด้วยเสียงฟูลดูเพล็กซ์แบบ end-to-end ที่พัฒนาตนเองได้รับการอัปเกรดอีกครั้ง ช่วยให้การสนทนาด้วยเสียงที่เป็นธรรมชาติและราบรื่นกับคนเสมือนมีความเป็นธรรมชาติและราบรื่นเหมือนคนจริง การเคลื่อนไหวครั้งนี้ถือเป็นก้าวสำคัญสำหรับ Soul ในการประยุกต์ใช้เทคโนโลยี AI ซึ่งจะทำให้ผู้ใช้ได้รับประสบการณ์ทางสังคมที่ดื่มด่ำและโต้ตอบได้มากขึ้น บทความนี้จะเจาะลึกคุณสมบัติเฉพาะของโมเดลขนาดใหญ่นี้และการสำรวจของ Soul ในสาขาโซเชียล AI
ในแทร็ก "AI + โซเชียล" ในประเทศ Soul App กำลังจะใช้งาน AI เพื่อเติมพลังใหม่!
เมื่อเร็วๆ นี้ Soul ได้ประกาศอย่างเป็นทางการว่ารูปแบบเสียงได้รับการอัปเกรดอีกครั้ง และมีการเปิดตัวรูปแบบการโทรด้วยเสียงแบบ full-duplex แบบ end-to-end ที่พัฒนาขึ้นเอง
เอฟเฟกต์ที่น่าทึ่งที่สุดของการอัพเกรดนี้คือการโทรด้วยเสียงระหว่างผู้ใช้และบุคคลเสมือนสามารถเป็นธรรมชาติและราบรื่นเหมือนกับการแชทกับคนจริง!
เอฟเฟ็กต์มีความสมจริงแค่ไหน คุณสามารถชมวิดีโอด้านล่างก่อนเพื่อทำความเข้าใจ:
ตัวอย่างอย่างเป็นทางการของ "ประสบการณ์การโทรแบบเรียลไทม์ด้วย AI"
มีอะไรพิเศษเกี่ยวกับรูปแบบการโทรด้วยเสียงแบบ end-to-end ที่พัฒนาขึ้นเองของ Soul ตามคำอธิบายอย่างเป็นทางการ ไฮไลท์ที่ใหญ่ที่สุด ได้แก่:
ด้วยเวลาแฝงในการโต้ตอบที่ต่ำมาก
การหยุดชะงักอัตโนมัติอย่างรวดเร็ว
การแสดงออกทางเสียงที่สมจริงสุด ๆ
การรับรู้ทางอารมณ์และความสามารถในการเข้าใจ ฯลฯ
ความสามารถในการหน่วงเวลาการโต้ตอบที่ต่ำเป็นพิเศษ หมายความว่าในขณะที่คุณพูด AI สามารถตอบสนองได้ทันทีโดยไม่มีความล่าช้าใด ๆ และระยะห่างระหว่างคุณกับ AI ก็สามารถสั้นลงได้ในทันที หากคุณต้องการสื่อสารกับมันจริงๆ คุณไม่จำเป็นต้องรอเลย มันเหมือนกับการพูดคุยกับคนจริงๆ
โมเดลเสียงขนาดใหญ่ของ Soul รองรับ การขัดจังหวะอัตโนมัติ อย่างรวดเร็ว กล่าวอีกนัยหนึ่งเมื่อคุณสื่อสารกับ AI หากคุณต้องการขัดจังหวะ AI จะสามารถเข้าใจสิ่งที่คุณหมายถึงได้อย่างสมบูรณ์และขัดจังหวะอีกฝ่ายได้อย่างง่ายดาย การโต้ตอบประเภทนี้น่าสนใจมาก!
สุดท้าย เมื่อรวมกับ การแสดงออกทางเสียงที่สมจริงเป็นพิเศษและความสามารถในการรับรู้และทำความเข้าใจทางอารมณ์ AI ไม่เพียงแต่สามารถเข้าใจคำพูดของคุณเท่านั้น แต่ยังรับรู้อารมณ์ของคุณและให้การตอบสนองที่เหมาะสมตามอารมณ์ของคุณอีกด้วย
จากตัวอย่างวิดีโออย่างเป็นทางการ หากฟีเจอร์นี้เปิดตัวอย่างเต็มรูปแบบในอนาคต คาดว่าผู้ใช้จำนวนมากอาจไม่สามารถแยกแยะระหว่างคนจริงกับคนเสมือน AI ได้เมื่อสัมผัสประสบการณ์บน Soul
Soul กล่าวว่าโมเดลการโทรด้วยเสียงขนาดใหญ่จากต้นทางถึงปลายทางได้ถูกนำไปใช้กับสถานการณ์การโทรแบบเรียลไทม์ "Echo of Another World" (ภายใต้การทดสอบภายใน) และจะขยายไปสู่การใช้งาน AI ที่หลากหลายและการโต้ตอบของ AI เช่น AI โกวตันในอนาคต

เป็นที่เข้าใจกันว่าภายในปี 2563 Soul ได้เปิดตัวการวิจัยและพัฒนาเทคโนโลยี AIGC โดยมุ่งเน้นไปที่การวิจัยและพัฒนาเทคโนโลยีสำคัญๆ เช่น บทสนทนาอัจฉริยะ เทคโนโลยีเสียง และมนุษย์เสมือนจริง พร้อมทั้งบูรณาการความสามารถ AI เหล่านี้อย่างลึกซึ้งเข้ากับสถานการณ์ทางสังคม
ในกระบวนการใช้ AI เพื่อยกระดับปฏิสัมพันธ์ทางสังคม Soul ให้ความสนใจเป็นพิเศษในการบรรลุประสบการณ์มิตรภาพทางอารมณ์และมานุษยวิทยาที่เป็นธรรมชาติ
เพื่อนำความคิดเห็นและมิตรภาพทางอารมณ์ที่ดีขึ้นมาสู่ผู้ใช้ ทีมเทคนิคของ Soul ได้ให้ความสำคัญกับความเข้าใจทางอารมณ์และปัญหาความล่าช้า พวกเขาได้เปิดตัวโมเดลการสร้างคำพูด โมเดลการรู้จำคำพูด โมเดลบทสนทนาด้วยเสียง โมเดลการสร้างเพลง ฯลฯ ที่พัฒนาขึ้นเอง ซึ่งรองรับการสร้างโทนเสียงจริง DIY เสียง การสลับหลายภาษา บทสนทนาแบบเรียลไทม์ที่ดื่มด่ำได้หลากหลายอารมณ์ และฟังก์ชันอื่น ๆ สิ่งเหล่านี้ได้ถูกนำไปใช้แล้วในหลาย ๆ สถานการณ์ของ Soul เช่น "AI Goudan", "Werewolf Phantom" การโต้ตอบด้วยเสียงแบบเรียลไทม์ของ AI, "Echo from Another World" เป็นต้น
รูปแบบการโทรด้วยเสียงจากต้นทางถึงปลายทางที่ Soul พัฒนาขึ้นเองนั้นขณะนี้ออนไลน์แล้ว ซึ่งหมายความว่าผู้ใช้สามารถเพลิดเพลินกับประสบการณ์การโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ที่เป็นธรรมชาติมากขึ้น ในอนาคต Soul ยังวางแผนที่จะส่งเสริมการสร้างความสามารถของโมเดลขนาดใหญ่แบบครบวงจรหลายรูปแบบ เพื่อทำให้ปฏิสัมพันธ์ระหว่างผู้คนกับ AI น่าสนใจและน่าดื่มด่ำยิ่งขึ้น
การอัพเกรดเทคโนโลยี AI ของ Soul ในครั้งนี้ไม่เพียงแต่ปรับปรุงประสบการณ์ผู้ใช้เท่านั้น แต่ยังมอบแนวคิดใหม่สำหรับทิศทางการพัฒนาในอนาคตของ "AI + โซเชียล" ผมเชื่อว่าในอนาคตอันใกล้นี้ เราจะได้เห็นการเกิดขึ้นของแอปพลิเคชันทางสังคมที่เป็นนวัตกรรมใหม่มากขึ้นโดยอาศัยเทคโนโลยี AI ซึ่งจะนำความสนุกสนานและความสะดวกสบายมาสู่ชีวิตทางสังคมของผู้คนมากขึ้น