Cohere merilis AYA Vision, model AI multimodal baru, menyediakan versi 32b dan 8b - artikel AI

Penulis：Eve Cole Waktu Pembaruan：2025-05-16 08:00:04

Bidang kecerdasan buatan telah mengantarkan terobosan besar, dan laboratorium penelitian nirlaba Cohere baru-baru ini merilis model AI multimodal yang disebut Aya Vision. Pencapaian inovatif ini telah menarik perhatian luas dalam industri ini dan dipuji oleh Cohere sebagai salah satu teknologi paling canggih saat ini.

Aya Vision menunjukkan keserbagunaan yang sangat baik, mampu menangani tugas-tugas kompleks termasuk pembuatan deskripsi gambar, pertanyaan terkait foto, terjemahan teks, dan penciptaan abstrak dalam 23 bahasa utama. Untuk mempromosikan penelitian ilmiah global, Cohere menyediakan teknologi ini secara gratis melalui platform WhatsApp, yang memungkinkan para peneliti di seluruh dunia untuk dengan mudah mengakses dan memanfaatkan pencapaian mutakhir ini.

Cohere disorot dalam blog resminya bahwa meskipun ada kemajuan yang signifikan dalam teknologi AI, masih ada kesenjangan yang signifikan dalam pemrosesan multibahasa dan tugas multimodal. Penelitian dan pengembangan Aya Vision adalah untuk menembus kemacetan teknis ini dan mempromosikan pengembangan lebih lanjut dari kecerdasan buatan di bidang-bidang lintas-bahasa dan modalitas silang.

Model ini tersedia dalam dua versi: Aya Vision32b dan Aya Vision8b. Di antara mereka, AYA Vision32b berkinerja baik dalam beberapa tolok ukur pemahaman visual, bahkan melampaui model kompetitif yang lebih besar, termasuk visi Llama-3.290b Meta. AYA Vision8b juga berkinerja baik, mengungguli model sepuluh kali ukurannya dalam beberapa evaluasi.

Kedua model ini telah dirilis pada platform pengembangan AI yang memeluk wajah, dan dilisensikan di bawah Creative Commons4.0, dan pengguna tunduk pada ketentuan penggunaan yang dapat diterima Cohere dan terbatas pada penggunaan non-komersial.

Dalam hal metode pelatihan, Cohere mengadopsi dataset bahasa Inggris "terdiversifikasi" yang inovatif untuk melatih model melalui terjemahan dan teknik anotasi sintetis. Teknologi anotasi sintetis ini dihasilkan oleh AI. Meskipun memiliki keterbatasan tertentu, telah diadopsi oleh banyak lembaga terkemuka, termasuk OpenAi, menunjukkan potensinya dalam meningkatkan kinerja model.

Cohere mengatakan bahwa penggunaan teknologi anotasi sintetis tidak hanya meningkatkan efisiensi pelatihan, tetapi juga secara signifikan mengurangi konsumsi sumber daya, mencerminkan keunggulan ganda perusahaan dalam inovasi teknologi dan optimasi sumber daya.

Untuk mendukung lebih banyak penelitian mendalam, Cohere juga telah meluncurkan AyavisionBench, alat evaluasi benchmark baru. Alat ini dirancang untuk mengevaluasi kinerja model dalam tugas visual dan kombinasi bahasa seperti pengenalan perbedaan gambar dan fitur kompleks screenshot-to-code.

Dengan latar belakang "krisis penilaian" saat ini dalam industri kecerdasan buatan, peluncuran AyavisionBench memberikan kerangka kerja yang lebih komprehensif dan menantang untuk evaluasi model, yang diharapkan dapat mempromosikan inovasi dalam standar evaluasi industri.

Blog resmi: https://cohere.com/blog/aya-vision