最近、TencentはHunyuan Big Modelシリーズの最新バージョンであるHunyuan -T1を正式にリリースしました。このモデルは、Hunyuan MediumScaleベースに基づいています。大規模なトレーニング後の後、特に深い思考と複雑な問題解決において、推論能力が大幅に向上します。今年2月にHunyuan T1-Previewが発売されて以来、ユーザーはより速く、より深い思考プロセスを経験しており、この公式バージョンの発売は、この一連の製品のさらなるアップグレードを示しています。

Hunyuan-T1の研究開発チームは、業界をリードする超大規模なハイブリッドトランスフォーマンマンバMOEモデルである最新のTurbos Dockを採用しました。ターボは、長いテキストの推論に対処する際に独自の利点を示し、コンテキストの損失と長距離情報依存の問題を効果的に解決します。さらに、Mambaアーキテクチャは、情報キャプチャ機能を維持しながら、コンピューティングリソースの消費を大幅に削減するために特別に最適化されています。公式データによると、同じ展開条件下では、Hunyuan-T1のデコード速度は2倍高速です。

トレーニング後の段階では、チームは強化学習トレーニングにコンピューティングパワーの96.7%を投資し、推論能力の向上と人間の好みの整合の最適化に焦点を当てました。チームは、数学、論理的推論、科学、コードなどの分野をカバーする多数の世界科学の問題を収集し、モデルがさまざまな推論タスクで優れたパフォーマンスを示すようにしました。コース学習方法は、モデルが複雑な推論タスクによりよく対処できるように、データの難易度を徐々に増やすためにトレーニングに採用されています。
経験の入り口:https://llm.hunyuan.tencent.com/?ref=producthunt#/chat/hy-t1