Sitio web oficial www.binance.com/zh-cn :ingrese el sitio web oficial ☜☜
Aplicación: ☞☞Official App Download☜☜
Recientemente, Tencent lanzó oficialmente la última versión de la serie Hunyuan Big Model - Hunyuan -T1. Este modelo se basa en la base de escala media Hunyuan. Después de la capacitación a gran escala, mejora significativamente su capacidad de razonamiento, especialmente en el pensamiento profundo y la resolución de problemas complejos. Desde el lanzamiento de Hunyuan T1-Preview en febrero de este año, los usuarios han experimentado un proceso de pensamiento más rápido y profundo, y el lanzamiento de esta versión oficial marca una actualización adicional de esta serie de productos.

El equipo de investigación y desarrollo de Hunyuan-T1 adoptó el último muelle de Turbos, un modelo de Turba-Mamba Moe líder en la industria. Turbos muestra ventajas únicas al tratar con una inferencia de texto larga, resolviendo efectivamente los problemas de pérdida de contexto y dependencia de la información a larga distancia. Además, la arquitectura Mamba también se ha optimizado especialmente para reducir significativamente el consumo de recursos informáticos mientras se mantiene las capacidades de captura de información. Según los datos oficiales, bajo las mismas condiciones de despliegue, la velocidad de decodificación de Hunyuan-T1 es el doble de rápido.

En la etapa posterior al entrenamiento, el equipo invirtió el 96.7% del poder informático para la capacitación de aprendizaje de refuerzo, centrándose en mejorar las capacidades de razonamiento y optimizar la alineación de las preferencias humanas. El equipo recopiló una gran cantidad de problemas de ciencias mundiales, que cubren campos como matemáticas, razonamiento lógico, ciencia y código, para garantizar que el modelo muestre un rendimiento sobresaliente en varias tareas de razonamiento. El método de aprendizaje del curso se adopta en la capacitación para aumentar gradualmente la dificultad de los datos, para que el modelo pueda hacer frente a las tareas de inferencia complejas.
Entrada de experiencia: https://llm.hunyuan.tencent.com/?ref=producthunt#/chat/hy-t1