ในสาขาปัญญาประดิษฐ์ฮูมเออีเพิ่งประกาศเปิดตัวผลิตภัณฑ์ใหม่ Octave ซึ่งเป็นระบบที่รู้จักกันในชื่อระบบการพูดแบบข้อความแรกที่ขับเคลื่อนด้วยรูปแบบภาษาขนาดใหญ่ (LLM) สิ่งที่นวัตกรรมในอ็อกเทฟคือไม่เพียง แต่สามารถสร้างเสียงธรรมชาติได้ แต่ยังเข้าใจอารมณ์ความรู้สึกจังหวะและจังหวะในบริบทซึ่งทำให้ผู้ใช้ได้รับเสียงที่สดใสและเป็นมนุษย์มากขึ้น
Alan Cowen ผู้ร่วมก่อตั้งและซีอีโอของ Hume AI กล่าวในการให้สัมภาษณ์กับสื่อว่าความตั้งใจดั้งเดิมของแบบจำลองคู่รักคือการทำให้กระบวนการสร้างข้อความเป็นคำพูดเป็นธรรมชาติและยืดหยุ่นมากขึ้น เขากล่าวว่าอ็อกเทฟสามารถระบุบุคลิกภาพและสถานะทางอารมณ์ของตัวละครโดยอัตโนมัติตามเนื้อหาข้อความอินพุตและปรับประสิทธิภาพเสียงตามนั้น ตัวอย่างเช่นประโยคประชดประชันจะแสดงด้วยน้ำเสียงประชดประชันในขณะที่เนื้อหาเร่งด่วนจะถูกนำเสนอด้วยน้ำเสียงเร่งด่วน

Octave ยังมีคุณสมบัติที่เป็นเอกลักษณ์ที่ผู้ใช้สามารถปรับเปลี่ยนเสียงที่สร้างขึ้นอย่างพิถีพิถันผ่านคำแนะนำภาษาธรรมชาติที่เรียบง่าย ซึ่งหมายความว่าผู้ใช้สามารถป้อนคำอธิบายโดยตรงเช่น "มีความสุข" และ "เศร้า" เพื่อให้เสียงที่สร้างขึ้นสอดคล้องกับความคาดหวังของพวกเขามากขึ้น Cowen เสริมว่า octave สามารถสร้างเสียงที่สอดคล้องกันได้ทันทีตามลักษณะของตัวละครเช่น "ชาวนายุคกลางประชดประชัน" และปรับตามการแสดงออกทางอารมณ์

ซึ่งแตกต่างจากรูปแบบการประมวลผลคำต่อคำแบบดั้งเดิมการเชื่อมโยงบริบทของค่า octave ค่าและสามารถจับการเปลี่ยนแปลงทางอารมณ์ในระดับประโยคและระหว่างประโยค ความสามารถนี้ทำให้อ็อกเทฟทำงานได้ดีขึ้นเมื่อต้องรับมือกับอารมณ์และบริบทที่ซับซ้อน
ด้วยการพัฒนาอย่างรวดเร็วของเทคโนโลยีปัญญาประดิษฐ์ระบบเสียงแหลมของ Hume AI ได้นำความเป็นไปได้ใหม่ ๆ มาสู่เทคโนโลยีแบบข้อความเป็นคำพูด ไม่เพียง แต่จะสามารถให้ตัวละครที่เป็นจริงมากขึ้นสำหรับอุตสาหกรรมเช่นการผลิตภาพยนตร์และโทรทัศน์และการพัฒนาเกม แต่ยังเปิดเส้นทางใหม่สำหรับแอพพลิเคชั่นในสาขาต่าง ๆ เช่นการศึกษาและการบริการลูกค้า นวัตกรรมนี้ใน Hume AI จะส่งเสริมการพัฒนาเทคโนโลยีเสียงและช่วยวิธีการสื่อสารที่เป็นธรรมชาติและอารมณ์มากขึ้น