27 февраля 2025 года Tencent официально выпустил Hunyuan New Generation of Kuaishou Model Turbo S. Этот выпуск знаменует собой значительный прорыв в технологии Big Model в области скорости и оптимизации характеристик. По сравнению с традиционными моделями медленного мышления, такими как DeepSeek R1 и Hunyuan T1, Hunyuan Turbo S реализует функцию «второй возврат», которая значительно улучшает скорость вывода ответов, удваивает скорость словаря и уменьшает задержку первого слова на 44%. Это инновация заставила модель хорошо работать во многих областях, таких как знания, математика и наука и создание, обеспечивая новое решение для быстрого отклика больших моделей.
Дизайн вдохновения Hunyuan Turbo S происходит из модели быстрого мышления, которая опирается на интуицию в ежедневном принятии человеческих решений, и объединяет модель медленного мышления рационального анализа, чтобы предоставить большие модели более умные и более эффективные возможности для решения проблем. Благодаря интеграции длинных и коротких цепочек мышления, модель не только сохраняет быстрый опыт по вопросам гуманитарных наук, но и значительно улучшает способность научных мышлений и значительно повышает общую производительность. В нескольких общедоступных тестах, обычно используемых в отрасли, Hunyuan Turbo S показал аналогичные эффекты с ведущими моделями, такими как DeepSeek V3, GPT4O и Claude.

С точки зрения архитектурных инноваций, Hunyuan Turbo S принимает модель слияния гибрид-мамба-трансформатора, которая эффективно снижает вычислительную сложность и использование кэша кэша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша кеша и кеша кеша кеша квадрата и кеша кеша квара кеша и кеша кеша кеша кеша и значительно снижает затраты на обучение и вывод. Эта гибридная архитектура прорывается благодаря проблемам высокой стоимости длительного обучения и вывода статьи в традиционных крупных моделях, и играет преимущество архитектуры мамбы при обработке длинных последовательностей, сохраняя при этом способность трансформатора захватывать сложные контексты, став первым в отрасли, который успешно применил архитектуру мамбы к моделям Super-Large MOE для без потери.
Как основная база серии Tencent Hunyuan, Hunyuan Turbo S предоставит основные возможности для производных моделей, таких как рассуждения, длинные статьи и код в будущем. Основываясь на Turbo S, Tencent также запустил модель вывода T1 с глубоким мышлением. Эта модель была полностью запущена на Tencent Yuanbao и скоро предоставит услуги API Access.
В настоящее время разработчики и корпоративные пользователи могут позвонить в Hunyuan Turbo S через API на официальном веб -сайте Tencent Cloud и насладиться скидкой на бесплатную пробную версию в течение недели. Цена этой модели состоит в том, чтобы ввести 0,8 токенов Yuan/Million и вывод 2 токена Yuan/Million, что является значительным снижением цен по сравнению с предыдущим поколением моделей Hunyuan Turbo. Кроме того, Hunyuan Turbo S будет постепенно запущен в Tencent Yuanbao. Пользователи могут выбрать модель «Хунюань» в Юанбао и отключить функцию глубокого мышления, чтобы испытать ее.
Tencent Hunyuan Turbos Model API Бесплатная пробная заявка: https://cloud.tencent.com/apply/p/i2zophus2x8