2025 년 2 월 27 일, Tencent는 공식적으로 Hunyuan New Generation의 Kuaishou Model Turbo S를 공식적으로 발표했습니다.이 릴리스는 응답 속도 및 성능 최적화로 큰 모델 기술의 주요 획기적인 획기적인 획기적인 것으로 나타났습니다. Hunyuan Turbo S는 DeepSeek R1 및 Hunyuan T1과 같은 전통적인 느린 사고 모델과 비교하여 "두 번째 리턴"기능을 깨닫고 응답 속도의 속도를 크게 향상시키고 어휘 속도를 두 배로 늘리고 44%감소합니다. 이 혁신은 지식, 수학 및 과학 및 창조와 같은 많은 분야에서 모델을 잘 수행하여 대형 모델의 신속한 응답 기능을위한 새로운 솔루션을 제공했습니다.
Hunyuan Turbo의 디자인 영감은 인간의 일상 의사 결정의 직관에 의존하는 빠른 사고 모델에서 파생되며, 합리적 분석의 느린 사고 모델을 결합하여 대형 모델에 더 똑똑하고 효율적인 문제 해결 기능을 제공합니다. 길고 짧은 사고 체인의 통합을 통해이 모델은 교양 문제에 대한 빠른 경험을 유지할뿐만 아니라 과학 추론 능력을 크게 향상시키고 전반적인 성과를 크게 향상시킵니다. Hunyuan Turbo S는 업계에서 일반적으로 사용되는 여러 공개 벤치 마크 테스트에서 DeepSeek V3, GPT4O 및 Claude와 같은 주요 모델과 유사한 효과를 보여주었습니다.

건축 혁신 측면에서 Hunyuan Turbo는 하이브리드-햄바 전송기 퓨전 모델을 채택하여 전통적인 변압기 구조의 계산 복잡성 및 KV- 캐시 캐시 사용을 효과적으로 감소시키고 교육 및 추론 비용을 크게 줄입니다. 이 하이브리드 아키텍처는 전통적인 대형 모델에서 긴 기사 교육 및 추론의 높은 비용 문제를 겪고 긴 시퀀스를 처리하는 데 Mamba 아키텍처의 이점을 제공하는 동시에 복잡한 컨텍스트를 캡처 할 수있는 변압기의 능력을 유지하여 MAMBA 아키텍처를 최초의 사례로 유지하여 MAMBA 아키텍처를 손상없는 MOE 모델에 성공적으로 적용 할 수 있습니다.
Tencent Hunyuan 시리즈의 핵심 기반 인 Hunyuan Turbo는 향후 추론, 긴 기사 및 코드와 같은 파생 모델에 대한 기본 기능을 제공 할 것입니다. Tencent는 터보 S를 기반으로 깊은 사고 능력으로 추론 모델 T1을 출시했습니다. 이 모델은 Tencent Yuanbao에서 완전히 출시되었으며 곧 API 액세스 서비스를 제공 할 것입니다.
현재 개발자와 엔터프라이즈 사용자는 Tencent Cloud 공식 웹 사이트의 API를 통해 Hunyuan Turbo S에 전화하여 일주일 이내에 무료 평가판을 즐길 수 있습니다. 이 모델의 가격은 0.8 위안/백만 토큰을 입력하고 2 위안/백만 토큰을 출력하는 것이며, 이는 이전 세대의 Hunyuan Turbo 모델에 비해 상당한 가격 인하입니다. 또한 Hunyuan Turbo는 Tencent Yuanbao에서 점차 출시 될 것입니다. 사용자는 Yuanbao에서 "Hunyuan"모델을 선택하고 깊은 사고 기능을 끄면 경험할 수 있습니다.
Tencent Hunyuan Turbos 모델 API 무료 시험 응용 프로그램 : https://cloud.tencent.com/apply/p/i2zophus2x8