IBM lanzó recientemente su último modelo de lenguaje Granite3.2, diseñado para proporcionar a las empresas y a las comunidades de código abierto una solución de IA empresarial "pequeña, eficiente y práctica". Este modelo no solo tiene capacidades multimodales y de razonamiento, sino que también mejora la flexibilidad y la rentabilidad, lo que facilita que los usuarios adopten. El lanzamiento de Granite3.2 marca un nuevo avance en el campo de inteligencia artificial de IBM, especialmente en la practicidad y la eficiencia en las aplicaciones de nivel empresarial.
Granite3.2 presenta el Modelo de lenguaje visual (VLM) para procesar documentos, realizar la clasificación de datos y la extracción. IBM afirma que este nuevo modelo tiene alcance de rendimiento o excede modelos más grandes en algunos puntos de referencia clave, como Llama3.211b y PixTral12b. Además, el modelo 8B de Granite3.2 también mostró la capacidad de igualar o superar modelos más grandes en puntos de referencia de razonamiento matemático estándar. Este avance hace que Granite 3.2 sea más eficiente al manejar tareas complejas al tiempo que reduce el consumo de recursos.
Para mejorar las capacidades de razonamiento, algunos modelos de Granite3.2 también tienen la función "Pensar en cadena", que puede aclarar los pasos de razonamiento intermedio. Aunque esta característica requiere mucha energía informática, los usuarios pueden habilitarla o deshabilitarla en cualquier momento, según sea necesario, para optimizar la eficiencia y reducir los costos generales. Sriram Raghavan, vicepresidente de investigación de IBM AI, dijo en la conferencia de prensa que el enfoque de la inteligencia artificial de próxima generación está en la eficiencia, la integración y el impacto práctico, lo que permite a las empresas lograr resultados sólidos sin gastar demasiado. La introducción de esta característica hace que Granite 3.2 sea más transparente e interpretable cuando se trata de tareas de inferencia complejas.
Además de la mejora de las capacidades de razonamiento, Granite3.2 también lanzó una versión miniaturizada del modelo de seguridad "Granite Guardian". Aunque el volumen se reduce en un 30%, su rendimiento permanece en el nivel de los modelos de generación anterior. Además, IBM ha introducido una capacidad llamada "confianza verbal" que permite una evaluación más detallada de los riesgos y considerar la incertidumbre en el monitoreo de seguridad. Esta innovación hace que Granite3.2 sea más confiable en términos de seguridad al tiempo que reduce el uso de recursos.
Granite3.2 está capacitado en el kit de herramientas de Fouring Open Docking de IBM, que permite a los desarrolladores convertir documentos en datos específicos necesarios para modelos AI empresariales personalizados. Durante el proceso de capacitación modelo, se procesaron 85 millones de archivos PDF y 26 millones de pares de preguntas y respuestas sintéticas para mejorar la capacidad de VLM para manejar flujos de trabajo de documentos complejos. Este proceso de capacitación hace que Granite3.2 sea más eficiente y preciso al procesar grandes cantidades de documentos.
IBM también anunció la próxima generación de TinyTimemixers (TTM), un modelo compacto previamente capacitado que se centra en la predicción de series temporales multivariables con capacidades de predicción a largo plazo hasta dos años. El lanzamiento de este modelo expande aún más el alcance de la aplicación de IBM en el campo del análisis de series de tiempo y proporciona a las empresas herramientas de predicción más precisas.
Blog oficial: https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-racacional
Puntos clave:
Granite3.2 presenta un modelo de lenguaje visual para mejorar el procesamiento de documentos y las capacidades de extracción de datos.
El nuevo modelo tiene la función de la cadena de pensamiento, que puede aclarar el proceso de razonamiento y mejorar la capacidad de razonamiento.
El modelo de seguridad de Granit Guardian está en un 30% en miniaturizado, pero su rendimiento no se ve afectado, y también introduce una función de evaluación de riesgos que puede ser verbalizada la confianza.