Am 27. Februar 2025 veröffentlichte Tencent offiziell die Hunyuan neue Generation von Kuaishou Model Turbo S. Diese Veröffentlichung ist ein großer Durchbruch in der großen Modelltechnologie in Bezug auf Reaktionsgeschwindigkeit und Leistungsoptimierung. Im Vergleich zu traditionellen langsamen Denkmodellen wie Deepseek R1 und Hunyuan T1 realisiert Hunyuan Turbo S die Funktion "Second Return", die die Geschwindigkeit der Ausgabe von Antworten erheblich verbessert, die Vokabulargeschwindigkeit verdoppelt und die Verzögerung des ersten Wortes um 44%verringert. Diese Innovation hat das Modell in vielen Bereichen wie Wissen, Mathematik und Naturwissenschaften und Schöpfung gut abschneiden und eine neue Lösung für die schnellen Reaktionsfunktionen großer Modelle bietet.
Die Entwurfsinspiration von Hunyuan Turbo s stammt aus dem schnellen Denken, das sich auf die Intuition bei der täglichen Entscheidungsfindung des Menschen beruht, und kombiniert das langsame Denkmodell der rationalen Analyse, um große Modelle mit schlaueren und effizienteren Fähigkeiten zur Problemlösung zu bieten. Durch die Integration langer und kurzer Denkketten behält das Modell nicht nur eine schnelle Erfahrung in Fragen der freien Künste, sondern verbessert auch die Fähigkeit zur wissenschaftlichen Begründung erheblich und verbessert die Gesamtleistung erheblich. Bei mehreren öffentlichen Benchmark -Tests, die üblicherweise in der Branche verwendet werden, haben der Hunyuan Turbo S ähnliche Auswirkungen wie führende Modelle wie Deepseek V3, GPT4O und Claude.

In Bezug auf die architektonische Innovation nimmt Hunyuan Turbos das Hybrid-Mamba-Transformator-Fusionsmodell an, das die Verwendung traditioneller Transformatorstrukturen effektiv reduziert und die Trainings- und Inferenzkosten erheblich reduziert. Diese Hybridarchitektur durchbricht die Probleme der hohen Kosten für lange Artikeltraining und Inferenz in traditionellen großen Modellen und spielt den Vorteil der Mamba-Architektur bei der Verarbeitung langer Sequenzen, während die Fähigkeit des Transformators, komplexe Kontexte zu erfassen, beibehalten, und der erste Fall in der Branche ist, um die Mamba-Architektur erfolgreich auf superlarge MOE-Modelle für den Verlustnutzung anzuwenden.
Als Kernbasis der Tencent Hunyuan -Serie wird Hunyuan Turbo in Zukunft grundlegende Funktionen für Derivatmodelle wie Argumentation, lange Artikel und Code bieten. Basierend auf Turbo S hat Tencent auch das Inferenzmodell T1 mit tiefem Denkfähigkeiten auf den Markt gebracht. Dieses Modell wurde vollständig auf Tencent Yuanbao gestartet und wird in Kürze API -Zugriffsdienste anbieten.
Gegenwärtig können Entwickler und Unternehmensbenutzer Hunyuan Turbos über die API auf der Tencent Cloud Official -Website anrufen und den Rabatt für kostenlose Testversion innerhalb einer Woche genießen. Der Preis dieses Modells besteht darin, 0,8 Yuan/Millionen -Token einzugeben und 2 Yuan/Millionen -Token auszugeben, was im Vergleich zur vorherigen Generation von Hunyuan Turbo -Modellen eine signifikante Preisreduzierung darstellt. Darüber hinaus wird Hunyuan Turbo S in Tencent Yuanbao nach und nach auf den Markt gebracht. Benutzer können das Modell "Hunyuan" in Yuanbao auswählen und die tiefe Denkfunktion ausschalten, um es zu erleben.
Tencent Hunyuan Turbos Model API kostenlose Testanwendung: https://cloud.tencent.com/apply/p/i2zophus2x8