IBM 最近發布了其最新的Granite3.2 大型語言模型,旨在為企業和開源社區提供“小巧、高效、實用”的企業人工智能解決方案。該模型不僅具備多模態和推理能力,還提升了靈活性和成本效益,使得用戶更容易採用。 Granite3.2 的發布標誌著IBM 在人工智能領域的新突破,尤其是在企業級應用中的實用性和效率方面。
Granite3.2 引入了視覺語言模型(VLM),用於處理文檔、進行數據分類和提取。 IBM 聲稱,這一新模型在一些關鍵基準測試中,性能達到或超過了更大型的模型,如Llama3.211B 和Pixtral12B。此外,Granite3.2 的8B 模型在標準數學推理基準測試中,也顯示出能匹敵或超越更大模型的能力。這一突破使得Granite3.2 在處理複雜任務時更加高效,同時降低了資源消耗。
為了提升推理能力,Granite3.2 的某些模型還具備“思維鏈”功能,能夠闡明中間推理步驟。該功能雖然需要較大的計算能力,但用戶可以根據需求隨時啟用或禁用,以優化效率並降低整體成本。 IBM AI 研究副總裁Sriram Raghavan 在發布會上表示,下一代人工智能的重點在於效率、整合與實際影響,讓企業在不超支的情況下實現強大的成果。這一功能的引入,使得Granite3.2 在處理複雜推理任務時更加透明和可解釋。
除了推理能力的提升,Granite3.2 還推出了“Granite Guardian”安全模型的小型化版本,儘管體積縮減了30%,但性能仍然保持在前一代模型的水平。此外,IBM 還引入了一種名為“可言語化信心”的能力,這種能力能夠更細緻地評估風險,並在安全監測中考慮不確定性。這一創新使得Granite3.2 在安全性方面更加可靠,同時減少了資源佔用。
Granite3.2 是在IBM 的開源Docling 工具包上訓練的,該工具包允許開發者將文檔轉換為定制的企業AI 模型所需的特定數據。模型訓練過程中處理了8500 萬份PDF 文件以及2600 萬個合成問答對,以增強VLM 處理複雜文檔工作流的能力。這一訓練過程使得Granite3.2 在處理大量文檔時更加高效和準確。
IBM 還宣布推出下一代TinyTimeMixers(TTM)模型,這是一種緊湊的預訓練模型,專注於多變量時間序列預測,具備最長可達兩年的長遠預測能力。這一模型的推出,進一步擴展了IBM 在時間序列分析領域的應用範圍,為企業提供了更加精準的預測工具。
官方博客: https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-reasoning-and-vision
劃重點:
Granite3.2 引入視覺語言模型,提昇文檔處理與數據提取能力。
新模型具備思維鏈功能,能夠闡明推理過程,增強推理能力。
Granit Guardian 安全模型小型化30%,但性能未受影響,同時推出可言語化信心的風險評估功能。