A IBM lançou recentemente seu mais recente modelo de linguagem Granite3.2, projetado para fornecer às empresas e comunidades de código aberto uma solução corporativa “pequena, eficiente e prática”. Esse modelo não apenas possui recursos multimodais e de raciocínio, mas também melhora a flexibilidade e a relação custo-benefício, facilitando a adoção dos usuários. O lançamento do Granite3.2 marca um novo avanço no campo de inteligência artificial da IBM, especialmente em praticidade e eficiência em aplicações em nível corporativo.
Granite3.2 apresenta o Modelo de Linguagem Visual (VLM) para o processamento de documentos, executando a classificação e extração de dados. A IBM afirma que esse novo modelo tem desempenho atingindo ou excedendo modelos maiores em alguns benchmarks importantes, como LLAMA3.211B e PIXTRAL12B. Além disso, o modelo 8B do Granite3.2 também mostrou a capacidade de combinar ou superar modelos maiores em benchmarks de raciocínio matemático padrão. Esse avanço torna o granito 3.2 mais eficiente ao lidar com tarefas complexas enquanto reduz o consumo de recursos.
Para melhorar os recursos de raciocínio, alguns modelos de Granite3.2 também têm a função "Chain de pensamento", que pode esclarecer as etapas de raciocínio intermediárias. Embora esse recurso exija muito poder de computação, os usuários podem ativá -lo ou desativá -lo a qualquer momento, conforme necessário, para otimizar a eficiência e reduzir os custos gerais. Sriram Raghavan, vice-presidente de pesquisa da IBM AI, disse na conferência de imprensa que o foco da inteligência artificial da próxima geração está na eficiência, integração e impacto prático, permitindo que as empresas obtenham resultados fortes sem gastar excessivamente. A introdução desse recurso torna o granito 3.2 mais transparente e interpretável ao lidar com tarefas complexas de inferência.
Além da melhoria dos recursos de raciocínio, a Granite3.2 também lançou uma versão miniaturizada do modelo de segurança "Granite Guardian". Embora o volume seja reduzido em 30%, seu desempenho permanece no nível dos modelos de geração anterior. Além disso, a IBM introduziu uma capacidade chamada "confiança verbal" que permite uma avaliação mais detalhada dos riscos e considerar a incerteza no monitoramento da segurança. Essa inovação torna o Granite3.2 mais confiável em termos de segurança, reduzindo o uso de recursos.
O Granite3.2 é treinado no Kit de ferramentas de documentos de código aberto da IBM, que permite aos desenvolvedores converter documentos em dados específicos necessários para os modelos de IA corporativos personalizados. Durante o processo de treinamento do modelo, 85 milhões de arquivos em PDF e 26 milhões de perguntas e respostas sintéticas foram processadas para aprimorar a capacidade da VLM de lidar com fluxos de trabalho de documentos complexos. Esse processo de treinamento torna o Granite3.2 mais eficiente e preciso ao processar grandes quantidades de documentos.
A IBM também anunciou a próxima geração de Modelo Tinytimemixers (TTM), um modelo pré-treinado compacto com foco na previsão de séries temporais multivariáveis com recursos de previsão de longo prazo em até dois anos. O lançamento deste modelo expande ainda mais o escopo de aplicativos da IBM no campo da análise de séries temporais e fornece às empresas ferramentas de previsão mais precisas.
Blog oficial: https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-reasoning-and-vision
Pontos -chave:
Granite3.2 apresenta um modelo de linguagem visual para melhorar os recursos de processamento de documentos e extração de dados.
O novo modelo tem a função de cadeia de pensamento, que pode esclarecer o processo de raciocínio e aprimorar a capacidade de raciocínio.
O modelo de segurança do Granit Guardian é 30% miniaturizado, mas seu desempenho não é afetado e também introduz uma função de avaliação de risco que pode ser uma confiança verbalizada.