Shanghai Step Star Intelligent Technology Co., Ltd. lançou oficialmente seu modelo de raciocínio autodesenvolvido Step Reasoner mini (Step R-mini) em 16 de janeiro de 2025. Este modelo é o primeiro modelo de inferência da série Step. Os usuários podem experimentar seus poderosos recursos de inferência por meio da página da web Yuewen. O Step R-mini tem um bom desempenho em muitas áreas, como raciocínio lógico, codificação, matemática e criação literária. Seu desempenho em vários testes de benchmark excede até mesmo o de alguns modelos concorrentes. O destaque deste modelo é a sua capacidade de levar em conta as competências em artes liberais e ciências, o que é raro entre modelos semelhantes.
Em 16 de janeiro de 2025, Shanghai Step Reasoner Intelligent Technology Co., Ltd. anunciou que seu modelo de raciocínio autodesenvolvido Step Reasoner mini ("Step R-mini") foi lançado oficialmente. Os usuários podem fazer login na página da Yuewen https://yuewen.cn e selecionar "Step R-mini" no canto superior esquerdo para experimentá-lo.
Step R-mini é o primeiro modelo de raciocínio da família de modelos da série Step. É bom para planejamento proativo, teste e reflexão e fornece aos usuários respostas precisas e confiáveis por meio do mecanismo lógico de pensamento lento e verificação repetida. Ele pode não apenas resolver problemas complexos, como raciocínio lógico, codificação e matemática, por meio de capacidades de raciocínio ultralongo, mas também levar em consideração campos gerais, como a criação literária.
A matriz do modelo básico da série Step, desenvolvida de forma independente pela Step Star, abrange recursos abrangentes, desde linguagem, multimodalidade até raciocínio. Em testes de benchmark matemáticos como AIME e Math, o desempenho do Step R-mini excede o o1-preview e é comparável ao OpenAI o1-mini. Ele também tem desempenho melhor do que o1-preview em tarefas de código do LiveCodeBench. Vale ressaltar que a maioria dos modelos de inferência não pode levar em consideração artes e ciências, mas o Step R-mini alcança “tanto artes quanto ciências” por meio de treinamento de aprendizagem por reforço em larga escala e do uso de algoritmos de aprendizagem por reforço On-Policy”, disse. pode não apenas responder com precisão a questões de matemática, codificação e raciocínio lógico, mas também completar de forma criativa a criação de conteúdo literário e tarefas diárias de bate-papo.

Em aplicações práticas, o Step R-mini apresenta excelentes resultados. Ao resolver problemas matemáticos, ao enfrentar problemas de Olimpíadas Matemáticas, pode construir uma cadeia de raciocínio razoável, realizar o planejamento e a solução passo a passo de problemas matemáticos complexos e enumerar diferentes soluções para validação cruzada. Ao lidar com problemas de geometria, você pode criar ativamente mídia de conteúdo para reflexão aprofundada por meio de esboços. Em tarefas de raciocínio lógico, experimente de forma independente uma variedade de ideias para resolução de problemas e faça perguntas a si mesmo para garantir que todas as boas soluções sejam enumeradas. Em termos de questões de codificação, você pode responder corretamente a questões de algoritmo com uma classificação de dificuldade "Difícil" na plataforma de tecnologia LeetCode. Você também pode lidar com requisitos de desenvolvimento complexos, analisar gradualmente as necessidades e intenções do usuário e construir lógica de código. Em termos de criação de conteúdo, você pode compreender profundamente as necessidades de expressão dos usuários, analisar temas criativos, temas literários e outros requisitos, pensar em ângulos criativos, retratar cenas, técnicas retóricas e estrutura de conteúdo, dar às coisas significado simbólico no nível emocional humano e adicione elementos personalizados e inovadores. Quando se trata de questões de tradução, seguimos o princípio de “fidelidade, elegância, elegância” e nos esforçamos para apresentar resultados de tradução precisos e significativos.
Além dos modelos de raciocínio linguístico, a Step Star também está construindo um modelo de raciocínio visual para integrar capacidades de raciocínio em modelos grandes com formas mais interativas. Visando o problema de raciocínio em cenas visuais complexas, as ideias de percepção lenta e raciocínio espacial são introduzidas para transferir a escala de tempo de teste do espaço de texto para o espaço visual para realizar o pensamento espacial lento no espaço visual. Atualmente, o modelo de raciocínio visual alcançou resultados iniciais, e a versão oficial deverá ser lançada para todos este ano.
O lançamento do Step R-mini marca um grande avanço para o Step Star no campo da inteligência artificial. Vale a pena esperar por suas poderosas capacidades de raciocínio e potencial de aplicação em vários campos. No futuro, continuaremos a prestar atenção ao desenvolvimento do Step Star no campo da inteligência artificial.