في الآونة الأخيرة ، أطلقت Tencent رسميًا نموذج التفكير العميق الذي تم تطويره ذاتيًا - النسخة الرسمية من Hunyuan T1. يمثل إصدار هذا النموذج خطوة جديدة في القوة التقنية لـ Tencent في مجال الذكاء الاصطناعي ، وخاصة في التفكير العميق وحل المشكلات المعقدة.
على أساس التعلم التعزيز على نطاق واسع ، فإن النسخة الرسمية من Hunyuan T1 لديها مشاكل علمية محسنة خصيصًا مثل الرياضيات والتفكير المنطقي والعلوم والرمز ، وبالتالي تحقيق تحسن كبير في قدرة التفكير. على المعايير الشائعة ، مثل MMLU-PRO ، حققت مجموعة بيانات تقييم نموذج اللغة الكبيرة ، Hunyuan T1 نتائج ممتازة قدرها 87.2 نقطة ، والثانية فقط إلى النموذج العلوي O1. في الوقت نفسه ، في الاختبارات القياسية العامة للمعرفة الصينية والإنجليزية مثل Ceval و Aime و Zebra Logic والرياضيات على مستوى المنافسة والتفكير المنطقي ، أظهر Hunyuan T1 أيضًا مستوى نموذج الاستدلال الرائد في الصناعة.

بالإضافة إلى إمكانات التفكير الأساسية ، يُظهر إصدار Hunyuan T1 الرسمي أيضًا القدرة على التكيف قوية للغاية في عدد من مهام المحاذاة ومهام متابعة التعليمات ومهام استخدام الأدوات. ويرجع ذلك إلى تبنيها للهندسة المعمارية المبتكر لـ Hunyuan Turbo S واعتمادها لنموذج الانصهار الهجري المحول. هذه هي المرة الأولى في الصناعة التي يتم فيها تطبيق بنية Mamba الهجينة بلا فقد على نماذج الاستدلال الفائقة ، مما يقلل بشكل فعال من التعقيد الحسابي لهياكل المحولات التقليدية وتقليل بصمة الذاكرة من ذاكرة التخزين المؤقتة KV ، وبالتالي تقليل تكاليف التدريب والاستدلال بشكل كبير.
بالإضافة إلى ذلك ، استنادًا إلى قدرات التقاط المقالات الممتازة على المدى الطويل ، يمكن لـ Hunyuan T1 أن يحل بشكل فعال فقدان السياق الشائع ومشاكل الاعتماد على المعلومات طويلة الأجل في التفكير طويل الأجل. تم تحسين بنية Mamba الهجينة خصيصًا لمعالجة التسلسل الطويلة. من خلال طرق حساب فعالة ، يمكن أن تقلل بشكل كبير من استهلاك الموارد مع ضمان القدرة على التقاط معلومات نصية طويلة. مع معلمات التنشيط المماثلة ، يحقق Hunyuan T1 سرعة فك تشفير بمقدار مرتين.
في الوقت الحاضر ، فتح Tencent Hunyuan T1 الخبرة وأطلق خدمات API. يمكن للمستخدمين الاستمتاع بالراحة والكفاءة التي يوفرها نموذج الاستدلال القوي هذا بناءً على احتياجاتهم بسعر إدخال 1 يوان لكل مليون رموز وسعر الإخراج 4 يوان لكل مليون رمز. سيوفر إطلاق هذه الخدمة بلا شك المطورين والمؤسسات مع حلول أكثر ذكاءً وتعزيز التطبيق على نطاق واسع لتكنولوجيا الذكاء الاصطناعي.