เมื่อเร็ว ๆ นี้ Tencent ได้เปิดตัวรูปแบบการคิดอย่างลึกซึ้งที่พัฒนาขึ้นเองอย่างเป็นทางการซึ่งเป็นรุ่นอย่างเป็นทางการของ Hunyuan T1 การเปิดตัวโมเดลนี้เป็นขั้นตอนใหม่ในความแข็งแกร่งทางเทคนิคของ Tencent ในด้านปัญญาประดิษฐ์โดยเฉพาะอย่างยิ่งในการให้เหตุผลเชิงลึกและการแก้ปัญหาที่ซับซ้อน
บนพื้นฐานของการเรียนรู้การเสริมแรงขนาดใหญ่รุ่นอย่างเป็นทางการของ Hunyuan T1 ได้ปรับปัญหาทางวิทยาศาสตร์เป็นพิเศษเช่นคณิตศาสตร์การใช้เหตุผลเชิงตรรกะวิทยาศาสตร์และรหัสดังนั้นจึงบรรลุการปรับปรุงที่สำคัญในความสามารถในการใช้เหตุผล สำหรับมาตรฐานทั่วไปเช่น MMLU-PRO ชุดข้อมูลการประเมินผลการประเมินแบบจำลองภาษาขนาดใหญ่ Hunyuan T1 ได้ผลลัพธ์ที่ยอดเยี่ยมของ 87.2 คะแนนรองจากโมเดล O1 ด้านบนเท่านั้น ในเวลาเดียวกันในการทดสอบมาตรฐานสาธารณะของความรู้ภาษาจีนและภาษาอังกฤษเช่น Ceval, Aime, Zebra Logic และคณิตศาสตร์ระดับการแข่งขันและการใช้เหตุผลเชิงตรรกะ Hunyuan T1 ยังแสดงให้เห็นถึงระดับโมเดลการอนุมานชั้นนำของอุตสาหกรรม

นอกเหนือจากความสามารถในการใช้เหตุผลขั้นพื้นฐานแล้วรุ่น Hunyuan T1 อย่างเป็นทางการยังแสดงให้เห็นถึงความสามารถในการปรับตัวที่แข็งแกร่งมากในงานการจัดตำแหน่งจำนวนมากงานการติดตามคำสั่งและงานการใช้เครื่องมือ นี่เป็นเพราะการยอมรับสถาปัตยกรรมที่เป็นนวัตกรรมของ Hunyuan Turbo S และการใช้โมเดลฟิวชั่น Hybrid-Mamba-Transformer นี่เป็นครั้งแรกในอุตสาหกรรมที่ Hybrid Mamba Architecture ได้ถูกนำไปใช้กับแบบจำลองการอนุมานที่มีขนาดใหญ่มากโดยลดความซับซ้อนในการคำนวณของโครงสร้างหม้อแปลงแบบดั้งเดิมและลดรอยเท้าหน่วยความจำของ KV-cache ซึ่งช่วยลดค่าใช้จ่ายในการฝึกอบรมและการอนุมานอย่างมีนัยสำคัญ
นอกจากนี้จากความสามารถในการจับภาพบทความระยะยาวที่ยอดเยี่ยม Hunyuan T1 สามารถแก้ปัญหาการสูญเสียบริบทร่วมกันได้อย่างมีประสิทธิภาพและปัญหาการพึ่งพาข้อมูลทางไกลในการให้เหตุผลระยะยาว สถาปัตยกรรม Mamba ไฮบริดได้รับการปรับให้เหมาะสมเป็นพิเศษสำหรับการประมวลผลลำดับที่ยาวนาน ด้วยวิธีการคำนวณที่มีประสิทธิภาพสามารถลดการใช้ทรัพยากรได้อย่างมากในขณะเดียวกันก็มั่นใจได้ถึงความสามารถในการบันทึกข้อมูลข้อความที่ยาวนาน ด้วยพารามิเตอร์การเปิดใช้งานที่คล้ายกัน Hunyuan T1 จะได้รับความเร็วในการถอดรหัส 2 ครั้ง
ในปัจจุบัน Tencent Hunyuan T1 ได้เปิดประสบการณ์และเปิดตัวบริการ API ผู้ใช้สามารถเพลิดเพลินกับความสะดวกสบายและประสิทธิภาพที่เกิดจากรูปแบบการอนุมานที่ทรงพลังนี้ตามความต้องการของพวกเขาในราคาอินพุต 1 หยวนต่อล้านโทเค็นและราคาผลผลิต 4 หยวนต่อล้านโทเค็น การเปิดตัวบริการนี้จะช่วยให้นักพัฒนาและองค์กรมีโซลูชั่นที่ชาญฉลาดมากขึ้นและส่งเสริมการประยุกต์ใช้เทคโนโลยีปัญญาประดิษฐ์อย่างกว้างขวาง