Hertz-Dev ซึ่งเป็นโมเดลเสียงโอเพนซอร์สที่ปฏิวัติวงการได้สร้างคลื่นขนาดใหญ่ในสาขาเสียง AI ด้วยพารามิเตอร์ 8.5 พันล้านพารามิเตอร์และข้อมูลเสียงคุณภาพสูง 20 ล้านชั่วโมง มันตระหนักถึงบทสนทนาแบบเรียลไทม์แบบฟูลเพล็กซ์และเวลาแฝงต่ำสุดที่ 120 มิลลิวินาทีคือการพัฒนาการปรับปรุงปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์ในระดับความราบรื่นและธรรมชาติที่ไม่เคยมีมาก่อนเปลี่ยนประสบการณ์การโต้ตอบของแบบจำลองเสียงก่อนหน้านี้อย่างสมบูรณ์ การพัฒนาหลักของมันอยู่ในเทคโนโลยีการพัฒนาแบบเต็มรูปแบบการบีบอัดเสียงที่ยอดเยี่ยมความสามารถในการสนทนาที่ยาวนานเป็นพิเศษและความล่าช้าในการปฏิวัติต่ำซึ่งช่วยให้นักพัฒนามีความเป็นไปได้ไม่ จำกัด
Hertz-Dev รุ่นโอเพนซอร์สที่ปฏิวัติวงการได้เกิดขึ้นและทำให้นักพัฒนาซอฟต์แวร์ตกใจทั่วโลกด้วยตัวชี้วัดประสิทธิภาพที่น่าทึ่ง มอนสเตอร์เสียง AI นี้ที่มีพารามิเตอร์ 8.5 พันล้านคนประสบความสำเร็จในการสนทนาแบบเรียลไทม์แบบเต็มเพล็กซ์ที่มนุษย์ฝันถึงการฝึกอบรมข้อมูลเสียงคุณภาพสูงถึง 20 ล้านชั่วโมง
สิ่งที่น่าตื่นตาตื่นใจที่สุดคือประสิทธิภาพความล่าช้าที่ต่ำเป็นพิเศษที่ 120 มิลลิวินาทีซึ่งเพิ่มโมเดลสาธารณะที่มีอยู่เป็นสองเท่าทำให้ประสบการณ์การสนทนาคอมพิวเตอร์ในระดับใหม่ทั้งหมด ลองนึกภาพว่าเมื่อคุณกำลังพูดคุยกับ AI คุณไม่ต้องรอให้คนอื่นพูดจบและคุณสามารถขัดจังหวะได้ตามธรรมชาติเช่นเดียวกับการสนทนาของมนุษย์ที่แท้จริง

การพัฒนาหลักของ Hertz-Dev ได้แก่ :
การพัฒนาเทคโนโลยีเต็มรูปแบบ: ล้มล้างรูปแบบการพูดแบบหมุนแบบดั้งเดิมอย่างสมบูรณ์และตระหนักถึงการสื่อสารแบบเรียลไทม์แบบสองทางที่แท้จริง
การบีบอัดเสียงที่ยอดเยี่ยม: ในขณะที่มั่นใจว่าคุณภาพเสียงสูงช่วยลดการใช้แบนด์วิดท์ได้อย่างมาก
ความสามารถในการสนทนาที่ยาวนานเป็นพิเศษ: เข้าใจได้ง่ายและสร้างเนื้อหาการสนทนาอย่างต่อเนื่อง
ความล่าช้าในการปฏิวัติต่ำ: ความเร็วการตอบสนอง 120 มิลลิวินาทีสร้างยุคใหม่ของการโต้ตอบแบบเรียลไทม์
ในฐานะที่เป็นโมเดลหม้อแปลงพื้นฐานที่มุ่งเน้นไปที่เสียง Hertz-Dev ใช้ประโยชน์จากข้อมูลการสนทนาในโลกแห่งความเป็นจริงอย่างเต็มที่ในระหว่างการฝึกอบรมและประสบความสำเร็จในการรวบรวมคุณสมบัติที่ละเอียดอ่อนในการพูดของมนุษย์รวมถึงจังหวะการหยุดชั่วคราวตามธรรมชาติ
สำหรับนักพัฒนานี่คือสมบัติโอเพนซอร์สที่มีค่า พวกเขาสามารถดาวน์โหลดโมเดลได้อย่างอิสระปรับแต่งตามสถานการณ์แอปพลิเคชันเฉพาะและสร้างแอพพลิเคชั่นเสียงที่เป็นนวัตกรรมต่างๆ ซึ่งหมายความว่าจากหุ่นยนต์บริการลูกค้าไปจนถึงผู้ช่วยเสียงตั้งแต่การสอนการศึกษาไปจนถึงการโต้ตอบกับความบันเทิงเราจะนำการก้าวกระโดดเชิงคุณภาพ
ที่อยู่โครงการ: https://github.com/standard-intelligence/hertz-dev
ฟีเจอร์โอเพ่นซอร์สของ Hertz-Dev ให้ศักยภาพในการพัฒนาอย่างมากและจะถูกนำไปใช้ในสาขามากขึ้นในอนาคตทำให้นักพัฒนาและผู้ใช้ได้รับประสบการณ์การโต้ตอบด้วยเสียงที่สะดวกและฉลาดขึ้น เราหวังว่าจะมีการพัฒนาอย่างต่อเนื่องของ Hertz-Dev ในอนาคตและนำนวัตกรรมมาสู่สนาม AI