IBM недавно выпустила свою новейшую модель Granite3.2 большой языковой модели, предназначенную для предоставления предприятиям и сообществам с открытым исходным кодом «небольшое, эффективное и практичное» решение искусственного интеллекта предприятия. Эта модель не только обладает мультимодальными и рассуждающими возможностями, но и повышает гибкость и экономическую эффективность, что облегчает принятие пользователей. Выпуск Granite3.2 отмечает новый прорыв в области искусственного интеллекта IBM, особенно в области практичности и эффективности в приложениях на уровне предприятия.
Granite3.2 представляет модель визуального языка (VLM) для обработки документов, выполнения классификации и извлечения данных. IBM утверждает, что эта новая модель обладает производительности, достигающей или превышающей более крупные модели в некоторых ключевых критериях, таких как Llama3.211b и Pixtral12b. Кроме того, модель 8B Granite3.2 также показала способность соответствовать или превзойти более крупные модели в стандартных математических критериях. Этот прорыв делает Granite 3.2 более эффективным при выполнении сложных задач, одновременно снижая потребление ресурсов.
Чтобы улучшить возможности рассуждений, некоторые модели Granite3.2 также имеют функцию «Think Chain», которая может прояснить промежуточные шаги рассуждения. Хотя эта функция требует большой вычислительной мощности, пользователи могут включить или отключить ее в любое время по мере необходимости для оптимизации эффективности и снижения общих затрат. Шрирам Рагхаван, вице-президент по исследованиям в IBM AI, заявил на пресс-конференции, что в центре внимания искусственного интеллекта следующего поколения находится эффективность, интеграция и практическое воздействие, позволяя предприятиям достигать сильных результатов без перерасхода. Введение этой функции делает Granite 3.2 более прозрачным и интерпретируемым при работе со сложными задачами вывода.
В дополнение к улучшению возможностей рассуждений, Granite3.2 также запустил миниатюрную версию модели безопасности «Гранит -опекун». Хотя объем уменьшается на 30%, его производительность остается на уровне моделей предыдущего поколения. Кроме того, IBM представила возможность, называемую «устной уверенностью», которая позволяет более подробной оценке рисков и учитывает неопределенность в мониторинге безопасности. Это инновация делает Granite3.2 более надежным с точки зрения безопасности при одновременном сокращении использования ресурсов.
Granite3.2 обучается на инструментарии с открытым исходным кодом IBM, который позволяет разработчикам конвертировать документы в конкретные данные, необходимые для индивидуальных моделей ИИ предприятия. Во время процесса обучения моделя было обработано 85 миллионов файлов PDF и 26 миллионов синтетических паров вопросов и ответов, чтобы повысить способность VLM обрабатывать сложные рабочие процессы документов. Этот учебный процесс делает Granite3.2 более эффективным и точным при обработке больших количеств документов.
IBM также анонсировала модель следующего поколения Tinytimemixers (TTM), компактной предварительно обученной модели, сосредоточенной на многомерном прогнозировании временных рядов с возможностями долгосрочного прогнозирования до двух лет. Запуск этой модели дополнительно расширяет объем приложений IBM в области анализа временных рядов и предоставляет предприятиям более точные инструменты прогнозирования.
Официальный блог: https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-reasoning-and-vision
Ключевые моменты:
Granite3.2 вводит модель визуального языка для улучшения возможностей обработки документов и извлечения данных.
Новая модель имеет функцию мышления, которая может прояснить процесс рассуждения и повысить способность рассуждения.
Модель безопасности Granit Guardian составляет 30% миниатюрной, но ее производительность не затрагивается, и она также вводит функцию оценки риска, которая может быть вербализованной уверенностью.