Flood Sung, ein Forscher auf der dunklen Seite des Moon Modell. Diese Offenlegung zeigt nicht nur den neuesten Fortschritt der dunklen Seite des Mondes auf dem Gebiet der künstlichen Intelligenz, sondern bietet der Branche auch wertvolle technische Referenz.
In dem Artikel erwähnte Flood Sung, dass die Bedeutung von Langstrecken (langkettiges Denken) tatsächlich von Tim Zhou Xinyu, Mitbegründer der dunklen Seite des Mondes, vor mehr als einem Jahr verifiziert wurde. Durch die Verwendung kleiner Modelle, um mehrstellige Operationen zu trainieren und feinkörnige Computerprozesse in langkettige Denkdaten für SFT (überwachte Feinabstimmung) umzuwandeln, erzielte das Team signifikante Ergebnisse. Diese Entdeckung bietet eine wichtige theoretische Grundlage für die nachfolgende Modelloptimierung.

Aufgrund von Kosteneinschränkungen hat sich die dunkle Seite des Mondes jedoch zuvor auf die Optimierung des langen Kontextes (Long Texteingabe) konzentriert. Flood Sung erklärte, dass der lange Kontext hauptsächlich Eingaben verarbeitet, und durch Vorab-Vorab- und Mooncake-Technologie kann das Team die Kosten und die Geschwindigkeit besser kontrollieren. Im Gegensatz dazu konzentriert sich die Langzeitbeteiligung mehr auf die Ausgabe und erfordert zwar erheblich, aber es erfordert zwar höhere Kosten und längere Verarbeitungszeiten, was die Anwendung in gewissem Maße einschränkt.
Die Veröffentlichung des OpenAI O1 -Modells hat jedoch dazu geführt, dass das Dark Side -Team die Prioritäten der technischen Richtung überdacht. Flood Sung betonte: "Die Leistung ist das Wichtigste, Kosten und Geschwindigkeit werden kontinuierlich mit technologischem Fortschritt optimiert. Der Schlüssel ist, zuerst durchbrachliche Leistung zu erzielen." -COT -Forschung. Diese strategische Anpassung markiert einen weiteren Durchbruch für das Team im Bereich der künstlichen Intelligenz.
Die Veröffentlichung dieses technischen Entschlüsselungsartikels markiert nicht nur, dass die dunkle Seite des Mondes begonnen hat, das O1 -Modell von OpenAI systematisch zu bewerten, sondern auch erhebliche Untersuchungen in verwandten Bereichen durchführt. Der lange Artikel von Flood Sung bietet der Branche detaillierte technische Erkenntnisse und bietet neue Ideen für zukünftige Forschungsrichtungen.
Für Leser, die ein detailliertes Verständnis des Cracking-Prozesses des O1-Modells haben möchten, kann über den folgenden Link zugegriffen werden, um den 10.000-Wörter-Long-Artikel von Flood Sung zu erreichen: Entschlüsseln Sie den 10.000-Wörter-langen Artikel des O1-Cracking-Prozesses .