เมื่อเร็ว ๆ นี้ Tencent เปิดตัวอย่างเป็นทางการของซีรีย์ Hunyuan Big Model รุ่นล่าสุด - Hunyuan -T1 รุ่นนี้ขึ้นอยู่กับฐานขนาดกลางของ Hunyuan หลังจากการฝึกอบรมขนาดใหญ่หลังการฝึกอบรมมันจะช่วยเพิ่มความสามารถในการใช้เหตุผลอย่างมีนัยสำคัญโดยเฉพาะอย่างยิ่งในการคิดอย่างลึกซึ้งและการแก้ปัญหาที่ซับซ้อน นับตั้งแต่เปิดตัว Hunyuan T1-Preview ในเดือนกุมภาพันธ์ปีนี้ผู้ใช้ได้ประสบกับกระบวนการคิดที่เร็วขึ้นและลึกซึ้งยิ่งขึ้นและการเปิดตัวเวอร์ชันทางการนี้นับเป็นการอัพเกรดผลิตภัณฑ์ชุดนี้เพิ่มเติม

ทีมวิจัยและพัฒนาของ Hunyuan-T1 ได้นำ Turbos Dock ล่าสุดมาใช้ซึ่งเป็นรุ่นชั้นนำระดับสูงของอุตสาหกรรมไฮบริด-Transformer-Mamba Moe Turbos แสดงข้อได้เปรียบที่ไม่ซ้ำกันเมื่อต้องรับมือกับการอนุมานข้อความยาว ๆ แก้ปัญหาการสูญเสียบริบทและการพึ่งพาข้อมูลทางไกลได้อย่างมีประสิทธิภาพ นอกจากนี้สถาปัตยกรรม Mamba ยังได้รับการปรับให้เหมาะสมเป็นพิเศษเพื่อลดการใช้ทรัพยากรการคำนวณอย่างมีนัยสำคัญในขณะที่ยังคงความสามารถในการเก็บข้อมูล จากข้อมูลอย่างเป็นทางการภายใต้เงื่อนไขการปรับใช้เดียวกันความเร็วในการถอดรหัสของ Hunyuan-T1 นั้นเร็วเป็นสองเท่า

ในขั้นตอนการฝึกอบรมหลังการฝึกอบรมทีมลงทุน 96.7% ของพลังการคำนวณสำหรับการฝึกอบรมการเรียนรู้การเสริมแรงโดยมุ่งเน้นที่การปรับปรุงความสามารถในการใช้เหตุผลและเพิ่มประสิทธิภาพการจัดตำแหน่งของการตั้งค่าของมนุษย์ ทีมได้รวบรวมปัญหาวิทยาศาสตร์โลกจำนวนมากครอบคลุมสาขาเช่นคณิตศาสตร์การใช้เหตุผลเชิงตรรกะวิทยาศาสตร์และรหัสเพื่อให้แน่ใจว่าแบบจำลองแสดงประสิทธิภาพที่โดดเด่นในงานการใช้เหตุผลที่หลากหลาย วิธีการเรียนรู้ของหลักสูตรถูกนำมาใช้ในการฝึกอบรมเพื่อเพิ่มความยากลำบากของข้อมูลเพื่อให้แบบจำลองสามารถรับมือกับงานอนุมานที่ซับซ้อนได้ดีขึ้น
ประสบการณ์ทางเข้า: https://llm.hunyuan.tencent.com/?ref=producthunt#/chat/hy-t1