IBM hat kürzlich sein neuestes Granite3.2 großes Sprachmodell veröffentlicht, mit dem Unternehmen und Open -Source -Communities eine „kleine, effiziente und praktische“ Unternehmenslösung bieten. Dieses Modell verfügt nicht nur über multimodale und argumentationsfähige Funktionen, sondern verbessert auch die Flexibilität und Kosteneffizienz und erleichtert den Benutzern die Übernahme. Die Veröffentlichung von Granite3.2 markiert einen neuen Durchbruch im Bereich der künstlichen Intelligenz von IBM, insbesondere in Bezug auf Praktikabilität und Effizienz in Anwendungen auf Unternehmensebene.
Granite3.2 führt das visuelle Sprachmodell (VLM) für die Verarbeitung von Dokumenten, die Durchführung von Datenklassifizierung und Extraktion vor. IBM behauptet, dass dieses neue Modell in einigen wichtigen Benchmarks wie LLAMA3.211b und Pixtral12b größere Modelle erreicht oder übertreffen. Darüber hinaus zeigte das 8B -Modell von Granite3.2 auch die Fähigkeit, größere Modelle in Standard -Benchmarks für mathematische Argumentation abzustimmen oder zu übertreffen. Dieser Durchbruch macht Granit 3.2 bei der Umstellung komplexer Aufgaben effizienter und reduziert gleichzeitig den Ressourcenverbrauch.
Um die Argumentationsfunktionen zu verbessern, haben einige Modelle von Granite3.2 auch die Funktion "Think Chain", die mittlere Argumentationsschritte klären können. Obwohl diese Funktion viel Rechenleistung erfordert, können Benutzer diese nach Bedarf jederzeit aktivieren oder deaktivieren, um die Effizienz zu optimieren und die Gesamtkosten zu senken. Sriram Raghavan, Vizepräsident für Forschung bei der IBM AI, sagte auf der Pressekonferenz, dass der Schwerpunkt der künstlichen Intelligenz der nächsten Generation auf Effizienz, Integration und praktischen Auswirkungen liegt und es Unternehmen ermöglicht, starke Ergebnisse ohne Übergabe zu erzielen. Die Einführung dieses Merkmals macht Granit 3.2 transparenter und interpretierbarer, wenn es sich um komplexe Inferenzaufgaben handelt.
Neben der Verbesserung der Argumentationsfunktionen startete Granite3.2 auch eine miniaturisierte Version des Sicherheitsmodells "Granite Guardian". Obwohl das Volumen um 30%reduziert wird, bleibt seine Leistung auf der Ebene der Modelle der Vorgängergeneration. Darüber hinaus hat IBM eine Fähigkeit eingeführt, die als „verbales Vertrauen“ bezeichnet wird und eine detailliertere Bewertung von Risiken ermöglicht und die Unsicherheit bei der Sicherheitsüberwachung berücksichtigt. Diese Innovation macht Granite3.2 in Bezug auf die Sicherheit zuverlässiger und reduziert gleichzeitig die Nutzung der Ressourcen.
Granite3.2 ist auf dem Open Source Docle -Toolkit von IBM geschult, mit dem Entwickler Dokumente in bestimmte Daten umwandeln können, die für kundenspezifische KI -Modelle für Unternehmen erforderlich sind. Während des Modelltrainingsprozesses wurden 85 Millionen PDF -Dateien und 26 Millionen synthetische Q & A -Paare verarbeitet, um die Fähigkeit von VLM zu verbessern, komplexe Dokument -Workflows zu verarbeiten. Dieser Schulungsprozess macht Granite3.2 effizienter und genauer bei der Bearbeitung großer Mengen an Dokumenten.
IBM kündigte außerdem das TTM-Modell (TinyTimemixer) der nächsten Generation von TinyTimemixers an, ein kompaktes vorgebildetes Modell, das sich auf die multivariable Zeitreihenvorhersage mit langfristigen Vorhersagefunktionen bis zu zwei Jahre konzentriert. Der Start dieses Modells erweitert den Anwendungsbereich von IBM im Bereich der Zeitreihenanalyse weiter und bietet Unternehmen genauere Vorhersage -Tools.
Offizieller Blog: https://www.ibm.com/new/Announcements/ibm-granite-3-2-open-source-rasoning-and-vision
Schlüsselpunkte:
Granite3.2 führt ein visuelles Sprachmodell ein, um die Funktionen zur Dokumentenverarbeitung und Datenextraktion zu verbessern.
Das neue Modell hat die Funktion der Denkkette, die den Argumentationsprozess klären und die Argumentationsfähigkeit verbessern kann.
Das Sicherheitsmodell von Granit Guardian ist zu 30% miniaturisiert, seine Leistung ist jedoch nicht beeinträchtigt und führt auch eine Risikobewertungsfunktion ein, die verbalisiert werden kann.