Kürzlich veröffentlichte Tencent offiziell die neueste Version der Hunyuan Big Model Series - Hunyuan -T1. Dieses Modell basiert auf der Hunyuan mittelgroßer Basis. Nach großem Maßstab nach dem Training verbessert es seine Argumentationsfähigkeit erheblich, insbesondere bei tiefem Denken und komplexer Problemlösung. Seit dem Start von Hunyuan T1-Präview im Februar dieses Jahres haben Benutzer einen schnelleren und tieferen Denken erlebt, und die Einführung dieser offiziellen Version ist ein weiteres Upgrade dieser Produktreihe.

Das Forschungs- und Entwicklungsteam von Hunyuan-T1 übernahm das neueste Turbos-Dock, ein branchenführendes hybrid-transformer-mamba-MOE-Modell mit ultra-großem Maßstab. Turbos zeigen einzigartige Vorteile beim Umgang mit langer Textinferenz und löst die Probleme des Kontextverlusts und der Abhängigkeit von Ferninformationen effektiv. Darüber hinaus wurde die MAMBA -Architektur speziell optimiert, um den Verbrauch von Rechenressourcen erheblich zu verringern und gleichzeitig die Funktionen für die Informationserfassung aufrechtzuerhalten. Laut offiziellen Daten ist die Dekodierungsgeschwindigkeit von Hunyuan-T1 unter denselben Bereitstellungsbedingungen doppelt so schnell.

In der Stadium nach dem Training investierte das Team 96,7% der Rechenleistung für das Training des Verstärkungslernens und konzentrierte sich auf die Verbesserung der Argumentationsfunktionen und die Optimierung der Ausrichtung der menschlichen Präferenzen. Das Team sammelte eine große Anzahl von weltwissenschaftlichen Problemen, die Bereiche wie Mathematik, logisches Denken, Naturwissenschaften und Code abdeckten, um sicherzustellen, dass das Modell bei verschiedenen Argumentationsaufgaben eine ausstehende Leistung aufweist. Die Kurslernmethode wird im Training übernommen, um die Datenschwierigkeit schrittweise zu erhöhen, damit das Modell besser mit komplexen Inferenzaufgaben fertig werden kann.
Erlebniseingang: https://llm.hunyuan.tencent.com/?ref=Producthunt#/chat/hy-t1