Em 27 de fevereiro de 2025, a Tencent lançou oficialmente a nova geração Hunyuan do modelo Kuaishou Turbo S. Este lançamento marca um grande avanço na tecnologia de grandes modelos na velocidade de resposta e na otimização do desempenho. Comparado aos modelos tradicionais de pensamento lento, como Deepseek R1 e Hunyuan T1, o Hunyuan Turbo s realiza a função "segundo retorno", o que melhora significativamente a velocidade das respostas de saída, dobra a velocidade do vocabulário e reduz o atraso da primeira palavra em 44%. Essa inovação fez com que o modelo tenha um bom desempenho em muitos campos, como conhecimento, matemática e ciência e criação, fornecendo uma nova solução para os recursos rápidos de resposta de grandes modelos.
A inspiração de design de Hunyuan Turbo S é derivada do modelo de pensamento rápido que depende da intuição na tomada de decisões diárias humanas e combina o modelo de pensamento lento da análise racional para fornecer aos grandes modelos com recursos de solução de problemas mais inteligentes e eficientes. Através da integração de cadeias de pensamentos longos e curtos, o modelo não apenas mantém uma experiência rápida em questões de artes liberais, mas também melhora significativamente a capacidade de raciocínio científico e melhora bastante o desempenho geral. Em vários testes públicos de referência comumente usados na indústria, o Hunyuan Turbo S mostrou efeitos semelhantes aos principais modelos como Deepseek V3, GPT4O e Claude.

Em termos de inovação arquitetônica, a Hunyuan Turbo s adota o modelo de fusão híbrido-transformador-transformador, que reduz efetivamente a complexidade computacional e o uso do cache do cache de kv das estruturas tradicionais de transformadores e reduz significativamente os custos de treinamento e inferência. Essa arquitetura híbrida rompe os problemas de alto custo de treinamento e inferência de artigos longos em grandes modelos tradicionais e desempenha a vantagem da arquitetura Mamba no processamento de sequências longas, mantendo a capacidade do transformador de capturar contextos complexos, tornando-se o primeiro caso da indústria a aplicar com sucesso a arquitetura Mamba aos modelos de MOE de super-largura para uso sem perda.
Como a base central da série Tencent Hunyuan, a Hunyuan Turbo s fornecerá recursos básicos para modelos derivados, como raciocínio, artigos longos e codificar no futuro. Com base no Turbo S, a Tencent também lançou o modelo de inferência T1 com capacidade de pensamento profundo. Este modelo foi totalmente lançado no Tencent Yuanbao e em breve fornecerá serviços de acesso à API.
Atualmente, desenvolvedores e usuários da empresa podem chamar a Hunyuan Turbo S através da API no site oficial da Tencent Cloud e aproveitar o desconto para avaliação gratuita em uma semana. O preço deste modelo é inserir 0,8 yuans/milhões de tokens e produzir 2 yuans/milhões de tokens, o que é uma redução significativa de preços em comparação com a geração anterior de modelos Hunyuan Turbo. Além disso, Hunyuan Turbo S será gradualmente lançado em Tencent Yuanbao. Os usuários podem selecionar o modelo "Hunyuan" em Yuanbao e desligar a função de pensamento profundo para experimentá -lo.
TENCENT HUNYUAN TURBOS Modelo API APLICAÇÃO GRATUITA DE API: https://cloud.tencent.com/apply/p/i2zophus2x8