Pada tanggal 27 Februari 2025, Tencent secara resmi merilis generasi baru Hunyuan dari model Kuaishou Turbo S. Rilis ini menandai terobosan besar dalam teknologi model besar dalam kecepatan respons dan optimasi kinerja. Dibandingkan dengan model berpikir lambat tradisional seperti Deepseek R1 dan HUNYUAN T1, HUNYUAN TURBO S menyadari fungsi "pengembalian kedua", yang secara signifikan meningkatkan kecepatan mengeluarkan jawaban, menggandakan kecepatan kosa kata, dan mengurangi keterlambatan kata pertama sebesar 44%. Inovasi ini telah membuat model ini berkinerja baik di banyak bidang seperti pengetahuan, matematika dan sains, dan penciptaan, memberikan solusi baru untuk kemampuan respons cepat model besar.
Inspirasi desain Hunyuan Turbo S berasal dari model pemikiran cepat yang bergantung pada intuisi dalam pengambilan keputusan sehari-hari manusia, dan menggabungkan model analisis rasional yang lambat untuk memberikan model besar dengan kemampuan pemecahan masalah yang lebih pintar dan lebih efisien. Melalui integrasi rantai berpikir panjang dan pendek, model ini tidak hanya mempertahankan pengalaman cepat pada masalah seni liberal, tetapi juga secara signifikan meningkatkan kemampuan penalaran sains, dan sangat meningkatkan kinerja keseluruhan. Dalam beberapa tes benchmark publik yang biasa digunakan dalam industri ini, Hunyuan Turbo S telah menunjukkan efek yang sama dengan model -model terkemuka seperti Deepseek V3, GPT4O, dan Claude.

Dalam hal inovasi arsitektur, Hunyuan Turbo S mengadopsi model fusi-transformer hybrid-mamba, yang secara efektif mengurangi kompleksitas komputasi dan penggunaan cache cache KV dari struktur transformator tradisional, dan secara signifikan mengurangi biaya pelatihan dan inferensi. Arsitektur hibrida ini memecahkan masalah pelatihan artikel panjang dan inferensi yang tinggi dalam model besar tradisional, dan memainkan keuntungan dari arsitektur Mamba dalam memproses urutan panjang, sambil mempertahankan kemampuan transformator untuk menangkap konteks yang kompleks, menjadi kasus pertama dalam industri untuk berhasil menerapkan arsitektur mamba untuk model MOE yang sangat besar untuk penggunaan tanpa kehilangan.
Sebagai basis inti dari seri Tencent Hunyuan, Hunyuan Turbo S akan memberikan kemampuan dasar untuk model turunan seperti penalaran, artikel panjang, dan kode di masa depan. Berdasarkan Turbo S, Tencent juga telah meluncurkan Inference Model T1 dengan kemampuan berpikir yang mendalam. Model ini telah sepenuhnya diluncurkan di Tencent Yuanbao dan akan segera menyediakan layanan akses API.
Saat ini, pengembang dan pengguna perusahaan dapat menghubungi Hunyuan Turbo S melalui API di situs web resmi Tencent Cloud dan menikmati diskon untuk uji coba gratis dalam waktu seminggu. Harga model ini adalah untuk memasukkan 0,8 yuan/juta token dan output 2 yuan/juta token, yang merupakan pengurangan harga yang signifikan dibandingkan dengan generasi sebelumnya dari model Turbo Hunyuan. Selain itu, Hunyuan Turbo S secara bertahap diluncurkan di Tencent Yuanbao. Pengguna dapat memilih model "Hunyuan" di Yuanbao dan mematikan fungsi berpikir yang mendalam untuk mengalaminya.
Tencent Hunyuan Turbos Model API Aplikasi Uji Coba Gratis: https://cloud.tencent.com/apply/p/i2zophus2x8