IBM baru -baru ini merilis model bahasa Granite3.2 terbaru, yang dirancang untuk memberikan perusahaan dan komunitas open source dengan solusi AI perusahaan yang “kecil, efisien, dan praktis”. Model ini tidak hanya memiliki kemampuan multimodal dan penalaran, tetapi juga meningkatkan fleksibilitas dan efektivitas biaya, sehingga memudahkan pengguna untuk mengadopsi. Rilis Granite3.2 menandai terobosan baru di bidang kecerdasan buatan IBM, terutama dalam kepraktisan dan efisiensi dalam aplikasi tingkat perusahaan.
Granite3.2 Memperkenalkan Model Bahasa Visual (VLM) untuk memproses dokumen, melakukan klasifikasi dan ekstraksi data. IBM mengklaim bahwa model baru ini memiliki kinerja mencapai atau melebihi model yang lebih besar di beberapa tolok ukur utama, seperti LLAMA3.211b dan Pixtral12b. Selain itu, model 8B Granite3.2 juga menunjukkan kemampuan untuk mencocokkan atau melampaui model yang lebih besar dalam tolok ukur penalaran matematika standar. Terobosan ini membuat granit 3.2 lebih efisien saat menangani tugas -tugas kompleks sambil mengurangi konsumsi sumber daya.
Untuk meningkatkan kemampuan penalaran, beberapa model Granite3.2 juga memiliki fungsi "Think Chain", yang dapat mengklarifikasi langkah -langkah penalaran perantara. Meskipun fitur ini membutuhkan banyak daya komputasi, pengguna dapat mengaktifkan atau menonaktifkannya kapan saja sesuai kebutuhan untuk mengoptimalkan efisiensi dan mengurangi biaya keseluruhan. Sriram Raghavan, wakil presiden penelitian di IBM AI, mengatakan pada konferensi pers bahwa fokus kecerdasan buatan generasi berikutnya adalah pada efisiensi, integrasi dan dampak praktis, yang memungkinkan perusahaan untuk mencapai hasil yang kuat tanpa pengeluaran berlebihan. Pengenalan fitur ini membuat Granite 3.2 lebih transparan dan dapat ditafsirkan saat berhadapan dengan tugas inferensi yang kompleks.
Selain peningkatan kemampuan penalaran, Granite3.2 juga meluncurkan versi miniatur dari model keamanan "Granite Guardian". Meskipun volume berkurang sebesar 30%, kinerjanya tetap pada tingkat model generasi sebelumnya. Selain itu, IBM telah memperkenalkan kemampuan yang disebut "kepercayaan verbal" yang memungkinkan penilaian risiko yang lebih rinci dan mempertimbangkan ketidakpastian dalam pemantauan keamanan. Inovasi ini membuat Granite3.2 lebih dapat diandalkan dalam hal keamanan sambil mengurangi penggunaan sumber daya.
Granite3.2 dilatih pada toolkit pengarahan open source IBM, yang memungkinkan pengembang untuk mengubah dokumen menjadi data spesifik yang diperlukan untuk model AI perusahaan yang disesuaikan. Selama proses pelatihan model, 85 juta file PDF dan 26 juta pasangan tanya jawab sintetis diproses untuk meningkatkan kemampuan VLM untuk menangani alur kerja dokumen yang kompleks. Proses pelatihan ini membuat granit3.2 Lebih efisien dan akurat saat memproses sejumlah besar dokumen.
IBM juga mengumumkan model generasi berikutnya dari TinyTimemixers (TTM), model pra-terlatih kompak yang berfokus pada prediksi deret waktu multivariabel dengan kemampuan prediksi jangka panjang hingga dua tahun. Peluncuran model ini lebih lanjut memperluas ruang lingkup aplikasi IBM di bidang analisis seri waktu dan memberikan perusahaan dengan alat prediksi yang lebih akurat.
Blog Resmi: https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-reasoning-and-vision
Poin -Poin Kunci:
Granite3.2 memperkenalkan model bahasa visual untuk meningkatkan pemrosesan dokumen dan kemampuan ekstraksi data.
Model baru memiliki fungsi rantai berpikir, yang dapat memperjelas proses penalaran dan meningkatkan kemampuan penalaran.
Model keamanan Granit Guardian adalah 30% miniatur, tetapi kinerjanya tidak terpengaruh, dan juga memperkenalkan fungsi penilaian risiko yang dapat menjadi keyakinan verbal.