IBM a récemment publié son dernier modèle de grande langue Granite3.2, conçu pour fournir aux entreprises et aux communautés open source une solution d'activité d'entreprise «petite, efficace et pratique». Ce modèle a non seulement des capacités multimodales et de raisonnement, mais améliore également la flexibilité et la rentabilité, ce qui facilite l'adoption des utilisateurs. La sortie de Granite3.2 marque une nouvelle percée dans le domaine de l'intelligence artificielle d'IBM, en particulier dans la pratique et l'efficacité des applications au niveau de l'entreprise.
Granite3.2 introduit le modèle de langage visuel (VLM) pour le traitement des documents, effectuant la classification et l'extraction des données. IBM affirme que ce nouveau modèle a des performances atteignant ou dépassant les modèles plus importants dans certaines références clés, telles que LLAMA3.211b et Pixtral12b. De plus, le modèle 8B de Granite3.2 a également montré la capacité de faire correspondre ou de dépasser les modèles plus grands dans des repères de raisonnement mathématique standard. Cette percée rend le granit 3.2 plus efficace lors de la gestion des tâches complexes tout en réduisant la consommation de ressources.
Afin d'améliorer les capacités de raisonnement, certains modèles de granit3.2 ont également la fonction de "chaîne de réflexion", qui peut clarifier les étapes de raisonnement intermédiaires. Bien que cette fonctionnalité nécessite beaucoup de puissance de calcul, les utilisateurs peuvent l'activer ou le désactiver à tout moment au besoin pour optimiser l'efficacité et réduire les coûts globaux. Sriram Raghavan, vice-président de la recherche à IBM AI, a déclaré lors de la conférence de presse que l'objectif de l'intelligence artificielle de nouvelle génération est sur l'efficacité, l'intégration et l'impact pratique, permettant aux entreprises d'obtenir des résultats solides sans dépenser trop. L'introduction de cette fonctionnalité rend le granit 3.2 plus transparent et interprétable lorsqu'il s'agit de tâches d'inférence complexes.
En plus de l'amélioration des capacités de raisonnement, Granite3.2 a également lancé une version miniaturisée du modèle de sécurité "Granite Guardian". Bien que le volume soit réduit de 30%, ses performances restent au niveau des modèles de génération précédente. De plus, IBM a introduit une capacité appelée «confiance verbale» qui permet une évaluation plus détaillée des risques et considérer l'incertitude dans la surveillance de la sécurité. Cette innovation rend Granite3.2 plus fiable en termes de sécurité tout en réduisant l'utilisation des ressources.
Granite3.2 est formé sur la boîte à outils de docling open source d'IBM, qui permet aux développeurs de convertir des documents en données spécifiques requises pour les modèles d'IA d'entreprise personnalisés. Au cours du processus de formation du modèle, 85 millions de fichiers PDF et 26 millions de paires de questions / réponses synthétiques ont été traitées pour améliorer la capacité de VLM à gérer les workflows de documents complexes. Ce processus de formation rend Granite3.2 plus efficace et précis lors du traitement de grandes quantités de documents.
IBM a également annoncé la prochaine génération de modèles Tinytimemixers (TTM), un modèle pré-formé compact se concentrant sur la prédiction multivariable des séries chronologiques avec des capacités de prédiction à long terme jusqu'à deux ans. Le lancement de ce modèle étend en outre la portée de l'application d'IBM dans le domaine de l'analyse des séries chronologiques et fournit aux entreprises des outils de prédiction plus précis.
Blog officiel: https://www.ibm.com/new/annonces/ibm-canite-3-2-open-source-easoning-and-vision
Points clés:
Granite3.2 introduit un modèle de langage visuel pour améliorer le traitement des documents et les capacités d'extraction des données.
Le nouveau modèle a la fonction de la chaîne de réflexion, qui peut clarifier le processus de raisonnement et améliorer la capacité de raisonnement.
Le modèle de sécurité de Granit Guardian est miniaturisé à 30%, mais ses performances ne sont pas affectées, et il introduit également une fonction d'évaluation des risques qui peut être verbalisée.