2025年2月27日、TencentはHunyuan New Generation of Kuaishou Model Turbo Sを正式にリリースしました。 Deepseek R1やHunyuan T1などの従来のゆっくりとした思考モデルと比較して、Hunyuan Turbo Sは「2番目のリターン」関数を実現します。これにより、回答の出力速度が大幅に向上し、語彙速度が2倍になり、最初の単語の遅延が44%減少します。この革新により、知識、数学、科学、創造などの多くの分野でモデルがうまく機能し、大規模なモデルの迅速な対応能力のための新しいソリューションを提供します。
Hunyuan Turbo Sのデザインインスピレーションは、人間の毎日の意思決定における直観に依存する高速思考モデルから派生しており、合理的な分析のゆっくりと思うモデルを組み合わせて、よりスマートで効率的な問題解決機能を大規模なモデルに提供します。モデルは、長くて短い思考チェーンを統合することで、リベラルアーツの問題に関する迅速な経験を維持するだけでなく、科学の推論能力を大幅に改善し、全体的なパフォーマンスを大幅に改善します。業界で一般的に使用されている複数のパブリックベンチマークテストでは、Hunyuan Turbo Sは、Deepseek V3、GPT4O、Claudeなどの主要なモデルと同様の効果を示しています。

建築革新の観点から、Hunyuan Turbo Sは、従来の変圧器構造の計算の複雑さとKVキャッシュキャッシュの使用を効果的に削減し、トレーニングコストと推論コストを大幅に削減するハイブリッドマンバ変換融合モデルを採用しています。このハイブリッドアーキテクチャは、従来の大きなモデルでの長い記事トレーニングと推論のコストの高い問題を突破し、長いシーケンスの処理においてMAMBAアーキテクチャの利点を果たし、複雑なコンテキストをキャプチャするトランスの能力を維持し、業界で最初のケースになり、MAMBAアーキテクチャを超大規模なMOEモデルに適用するための最初のケースになります。
Tencent Hunyuanシリーズの中心的な基盤として、Hunyuan Turbo Sは、将来、推論、長い記事、コードなどのデリバティブモデルに基本的な機能を提供します。 Turbo Sに基づいて、Tencentは深い思考能力を備えた推論モデルT1も起動しました。このモデルは、Tencent Yuanbaoで完全に発売されており、まもなくAPIアクセスサービスを提供します。
現在、開発者とエンタープライズユーザーは、Tencent Cloudの公式WebサイトでAPIを介してHunyuan Turbo Sを呼び出し、1週間以内に無料トライアルの割引を楽しむことができます。このモデルの価格は、0.8元/百万トークンを入力し、2元/百万トークンを出力することです。これは、前世代のHunyuan Turboモデルと比較して大幅な価格削減です。さらに、Hunyuan Turbo SはTencent Yuanbaoで徐々に発売されます。ユーザーは、Yuanbaoで「Hunyuan」モデルを選択し、深い思考機能をオフにして体験できます。
Tencent Hunyuan TurbosモデルAPI無料試用アプリケーション:https://cloud.tencent.com/apply/P/I2Zophus2x8