في الآونة الأخيرة ، أصدرت Tencent رسميًا أحدث إصدار من سلسلة Hunyuan Big Model - Hunyuan -T1. يعتمد هذا النموذج على قاعدة هانايوان متوسطة النطاق. بعد التدريب على نطاق واسع ، فإنه يحسن بشكل كبير قدرته على التفكير ، وخاصة في التفكير العميق وحل المشكلات المعقدة. منذ إطلاق Hunyuan T1-Preview في فبراير من هذا العام ، شهد المستخدمون عملية تفكير أسرع وأعمق ، ويمثل إطلاق هذه النسخة الرسمية ترقية أخرى لهذه السلسلة من المنتجات.

اعتمد فريق البحث والتطوير في Hunyuan-T1 أحدث Turbos Dock ، وهو نموذج MONE الهجينة النطاق الرائد في الصناعة. يُظهر Turbos مزايا فريدة عند التعامل مع استنتاج النص الطويل ، وحل مشكلات فقدان السياق بشكل فعال واعتماد المعلومات على المدى الطويل. بالإضافة إلى ذلك ، تم أيضًا تحسين بنية Mamba بشكل خاص لتقليل استهلاك موارد الحوسبة بشكل كبير مع الحفاظ على قدرات التقاط المعلومات. وفقًا للبيانات الرسمية ، في ظل نفس ظروف النشر ، تكون سرعة فك التشفير لـ Hunyuan-T1 بسرعة.

في مرحلة ما بعد التدريب ، استثمر الفريق 96.7 ٪ من قوة الحوسبة للتدريب على التعلم التعزيز ، مع التركيز على تحسين قدرات التفكير وتحسين توافق التفضيلات البشرية. جمع الفريق عددًا كبيرًا من مشاكل العلوم العالمية ، التي تغطي مجالات مثل الرياضيات ، والمنطق المنطقي ، والعلوم والرمز ، لضمان أن النموذج يظهر الأداء المتميز في مهام التفكير المختلفة. تم اعتماد طريقة تعلم الدورة التدريبية في التدريب لزيادة صعوبة البيانات تدريجياً ، بحيث يمكن للنموذج التعامل بشكل أفضل مع مهام الاستدلال المعقدة.
دخول الخبرة: https://llm.hunyuan.tencent.com/؟ref=producthunt#/chat/hy-t1