Shanghai Step Reasoner Intelligent Technology Co., Ltd. hat am 16. Januar 2025 offiziell sein selbst entwickeltes Reasoning-Modell Step Reasoner mini (Step R-mini) eingeführt. Dieses Modell ist das erste Inferenzmodell in der Step-Reihe. Benutzer können seine leistungsstarken Inferenzfunktionen auf der Yuewen-Webseite erleben. Step R-mini schneidet in vielen Bereichen wie logisches Denken, Codieren, Mathematik und literarisches Schaffen gut ab. Seine Leistung in mehreren Benchmark-Tests übertrifft sogar die einiger Konkurrenzmodelle. Der Clou dieses Modells ist seine Fähigkeit, geisteswissenschaftliche und naturwissenschaftliche Fähigkeiten zu kombinieren, was bei vergleichbaren Modellen selten vorkommt.
Am 16. Januar 2025 gab Shanghai Step Reasoner Intelligent Technology Co., Ltd. bekannt, dass sein selbst entwickeltes Reasoning-Modell Step Reasoner mini („Step R-mini“) offiziell eingeführt wurde. Benutzer können sich auf der Yuewen-Webseite https://yuewen.cn anmelden und oben links „Step R-mini“ auswählen, um es zu erleben.
Step R-mini ist das erste Argumentationsmodell in der Modellfamilie der Step-Serie. Es eignet sich gut für proaktives Planen, Ausprobieren und Nachdenken und bietet Benutzern genaue und zuverlässige Antworten durch den Logikmechanismus des langsamen Denkens und der wiederholten Überprüfung. Es kann nicht nur komplexe Probleme wie logisches Denken, Codierung und Mathematik durch Fähigkeiten zum ultralangen Denken lösen, sondern auch allgemeine Bereiche wie das literarische Schaffen berücksichtigen.
Die von Step Star unabhängig entwickelte Basismodellmatrix der Step-Serie deckt umfassende Funktionen von Sprache über Multimodalität bis hin zum Denken ab. In mathematischen Benchmark-Tests wie AIME und Math übertrifft die Leistung von Step R-mini die von o1-preview und ist mit der von OpenAI o1-mini vergleichbar. Außerdem ist die Leistung bei LiveCodeBench-Codeaufgaben besser als bei o1-preview. Es ist erwähnenswert, dass die meisten Inferenzmodelle nicht sowohl Künste als auch Wissenschaften berücksichtigen können, aber Step R-mini erreicht „sowohl Künste als auch Wissenschaften“ durch groß angelegtes Reinforcement-Learning-Training und den Einsatz von On-Policy-Reinforcement-Learning-Algorithmen kann nicht nur Fragen zu Mathematik, Codierung und logischem Denken genau beantworten, sondern auch die Erstellung literarischer Inhalte und tägliche Chat-Aufgaben kreativ erledigen.

In praktischen Anwendungen zeigt Step R-mini hervorragende Ergebnisse. Bei der Lösung mathematischer Probleme und bei Problemen der Mathematikolympiade kann eine vernünftige Argumentationskette aufgebaut, die Planung und schrittweise Lösung komplexer mathematischer Probleme realisiert und verschiedene Lösungen für die Kreuzvalidierung aufgezählt werden. Bei der Bearbeitung von Geometrieproblemen können Sie durch Skizzieren aktiv Inhaltsmedien für vertieftes Nachdenken erstellen. Probieren Sie bei Aufgaben zum logischen Denken unabhängig voneinander verschiedene Problemlösungsideen aus und stellen Sie sich selbst Fragen, um sicherzustellen, dass alle guten Lösungen aufgelistet werden. In Bezug auf Codierungsfragen können Sie Algorithmusfragen mit der Schwierigkeitsbewertung „Schwer“ auf der LeetCode-Technologieplattform korrekt beantworten. Sie können auch komplexe Entwicklungsanforderungen bewältigen, Benutzerbedürfnisse und -absichten schrittweise analysieren und Codelogik erstellen. In Bezug auf die Erstellung von Inhalten können Sie die Ausdrucksbedürfnisse der Benutzer genau verstehen, kreative Themen, literarische Themen und andere Anforderungen analysieren, über kreative Aspekte nachdenken, Szenen, rhetorische Techniken und Inhaltsstruktur darstellen und den Dingen auf der menschlichen emotionalen Ebene eine symbolische Bedeutung verleihen und fügen Sie personalisierte und innovative Elemente hinzu. Wenn es um Übersetzungsfragen geht, folgen wir dem Grundsatz „Treue, Eleganz, Eleganz“ und sind bestrebt, genaue und aussagekräftige Übersetzungsergebnisse zu präsentieren.
Zusätzlich zu sprachbasierten Argumentationsmodellen entwickelt Step Star auch ein visuelles Argumentationsmodell, um Argumentationsfunktionen in große Modelle mit interaktiveren Formen zu integrieren. Mit Blick auf das Argumentationsproblem in komplexen visuellen Szenen werden die Ideen der langsamen Wahrnehmung und des räumlichen Denkens eingeführt, um die Testzeitskalierung vom Textraum auf den visuellen Raum zu übertragen und so räumliches langsames Denken im visuellen Raum zu realisieren. Derzeit hat das visuelle Argumentationsmodell erste Ergebnisse erzielt und die offizielle Version wird voraussichtlich noch in diesem Jahr für alle veröffentlicht.
Die Einführung von Step R-mini markiert einen großen Durchbruch für Step Star auf dem Gebiet der künstlichen Intelligenz. Seine leistungsstarken Argumentationsfunktionen und sein vielseitiges Anwendungspotenzial sind es wert, gespannt zu sein. Auch in Zukunft werden wir unser Augenmerk auf die Weiterentwicklung von Step Star im Bereich der künstlichen Intelligenz richten.