IBM은 최근 최신 Granite3.2 대형 언어 모델을 발표했으며, 기업 및 오픈 소스 커뮤니티에 "작고 효율적이며 실용적"엔터프라이즈 AI 솔루션을 제공하도록 설계되었습니다. 이 모델에는 다중 모드 및 추론 기능이있을뿐만 아니라 유연성과 비용 효율성을 향상시켜 사용자가 쉽게 채택 할 수 있습니다. Granite3.2의 출시는 IBM의 인공 지능 분야, 특히 엔터프라이즈 수준의 응용 프로그램의 실용성과 효율성에서 새로운 획기적인 발전을 보여줍니다.
Granite3.2는 문서 처리, 데이터 분류 수행 및 추출을위한 VLM (Visual Language Model)을 소개합니다. IBM 은이 새로운 모델이 LLAMA3.211B 및 PIXTRAL12B와 같은 일부 주요 벤치 마크에서 더 큰 모델에 도달하거나 더 큰 모델에 도달하거나 초과한다고 주장합니다. 또한 Granite3.2의 8B 모델은 표준 수학적 추론 벤치 마크에서 더 큰 모델을 일치 시키거나 능가하는 능력을 보여주었습니다. 이 돌파구는 복잡한 작업을 처리하면서 자원 소비를 줄일 때 화강암 3.2를 더 효율적으로 만듭니다.
추론 능력을 향상시키기 위해 Granite3.2의 일부 모델에는 "사고"기능이 있으며 이는 중간 추론 단계를 명확하게 할 수 있습니다. 이 기능에는 많은 컴퓨팅 성능이 필요하지만 사용자는 효율성을 최적화하고 전체 비용을 줄이기 위해 언제든지 필요에 따라이를 활성화하거나 비활성화 할 수 있습니다. IBM AI의 연구 부사장 인 Sriram Raghavan은 기자 회견에서 차세대 인공 지능의 초점은 효율성, 통합 및 실질적인 영향에 중점을 두어 기업이 과도하게 지출하지 않고 강력한 결과를 얻을 수 있다고 말했다. 이 기능을 도입하면 복잡한 추론 작업을 처리 할 때 화강암 3.2가 더 투명하고 해석 할 수 있습니다.
Granite3.2는 추론 기능의 개선 외에도 "Granite Guardian"보안 모델의 소형 버전을 출시했습니다. 부피가 30%감소하지만 성능은 이전 세대 모델 수준으로 남아 있습니다. 또한 IBM은 "언어 신뢰"라는 기능을 도입하여 위험에 대한보다 자세한 평가를 제공하고 보안 모니터링의 불확실성을 고려했습니다. 이 혁신은 Granite3.2 보안 측면에서 더 신뢰할 수있는 동시에 자원 사용을 줄입니다.
Granite3.2는 IBM의 오픈 소스 DOCLING 툴킷에 대해 교육을 받았으며,이를 통해 개발자는 문서를 맞춤형 엔터프라이즈 AI 모델에 필요한 특정 데이터로 변환 할 수 있습니다. 모델 교육 과정에서 8 천 5 백만 PDF 파일과 2,600 만 합성 Q & A 쌍이 처리되어 복잡한 문서 워크 플로우를 처리하는 VLM의 능력을 향상 시켰습니다. 이 교육 과정은 많은 양의 문서를 처리 할 때 Granite3.2를보다 효율적이고 정확하게 만듭니다.
IBM은 또한 최대 2 년 동안 장기 예측 기능을 갖춘 다변량 시계열 예측에 중점을 둔 소형 미리 훈련 된 모델 인 차세대 TTM (TinytimeMixers) 모델을 발표했습니다. 이 모델의 출시는 시계열 분석 분야에서 IBM의 애플리케이션 범위를 더욱 확장하고보다 정확한 예측 도구를 기업에 제공합니다.
공식 블로그 : https://www.ibm.com/new/announcements/ibm-granite-3-open-source-reasoning-and-vision
핵심 사항 :
Granite3.2는 문서 처리 및 데이터 추출 기능을 향상시키기위한 시각적 언어 모델을 소개합니다.
새로운 모델은 사고 체인의 기능을 가지고있어 추론 과정을 명확히하고 추론 능력을 향상시킬 수 있습니다.
Granit Guardian의 보안 모델은 30% 소형화되었지만 성능은 영향을받지 않으며, 또한 구두로 확신 할 수있는 위험 평가 기능도 소개합니다.