Google meluncurkan versi baru yang ditingkatkan dari seri model Gemini 1.5, Gemini-1.5-Pro-002 dan Gemini-1.5-Flash-002 membuat debut yang mengejutkan! Editor Downcodes mengetahui bahwa pembaruan ini tidak hanya membawa peningkatan kinerja yang signifikan, namun juga pengurangan harga yang signifikan, yang dapat digambarkan sebagai kabar baik utama di bidang pengembangan AI. Peningkatan kinerjanya luar biasa, dan biayanya berkurang lebih dari setengahnya, yang tentunya sangat menarik bagi pengembang dan pengguna perusahaan. Mari kita lihat peningkatan menarik apa saja yang dibawa oleh pembaruan ini.
Google hari ini mengumumkan peluncuran seri model Gemini baru yang ditingkatkan, termasuk Gemini-1.5-Pro-002 dan Gemini-1.5-Flash-002. Pembaruan ini tidak hanya meningkatkan kinerja secara signifikan, tetapi juga memberikan diskon harga yang mengejutkan, yang tidak diragukan lagi akan memicu ledakan dalam lingkaran pengembangan AI.
Pertama-tama, hal yang paling menarik perhatian adalah penurunan harga yang signifikan. Biaya penggunaan model versi baru telah dipotong setengahnya, lebih dari 50%. Pada saat yang sama, kinerja telah meningkat secara signifikan. Kecepatan pemrosesan Gemini1.5Flash menjadi dua kali lipat, sedangkan Gemini1.5Pro hampir tiga kali lipat. Artinya, pengembang dapat memperoleh keluaran lebih cepat dan latensi lebih pendek dengan biaya lebih rendah, sehingga sangat meningkatkan efisiensi pengembangan.

Dari segi performa, model Gemini baru menunjukkan peningkatan menyeluruh. Khususnya dalam bidang matematika, pemrosesan teks panjang, dan tugas visual, kemajuannya sangat jelas. Misalnya, model kini dapat dengan mudah memproses dokumen PDF lebih dari 1.000 halaman, menjawab pertanyaan yang berisi puluhan ribu baris kode, dan bahkan mengekstrak informasi berguna dari video berdurasi satu jam. Pada pengujian benchmark MMLU-Pro yang menantang, model baru ini mencapai peningkatan kinerja sekitar 7%. Yang lebih mengesankan lagi adalah pada benchmark MATH dan HiddenMath, peningkatannya mencapai 20%.

Google juga telah mengoptimalkan kualitas respons model. Versi baru memberikan jawaban yang lebih bermanfaat dan ringkas sekaligus menjaga konten tetap aman. Dalam tugas-tugas seperti peringkasan, tanya jawab, dan ekstraksi informasi, panjang keluaran dipersingkat 5% hingga 20% dibandingkan sebelumnya, yang tidak hanya meningkatkan efisiensi tetapi juga semakin mengurangi biaya penggunaan.
Untuk pengguna perusahaan, kemampuan pemrosesan teks panjang Gemini1.5Pro (hingga 2 juta kata) dan kemampuan multi-modal membuka skenario aplikasi baru. Mulai 1 Oktober 2024, harga token masukan, token keluaran, dan token cache tambahan akan diturunkan masing-masing sebesar 64%, 52%, dan 64%, yang tentunya akan sangat mengurangi biaya penggunaan AI untuk perusahaan.

Google juga telah melakukan penyesuaian signifikan terkait pembatasan penggunaan. Batas tarif layanan berbayar Gemini1.5Flash ditingkatkan menjadi 2.000 permintaan per menit, dan 1.5Pro ditingkatkan menjadi 1.000 permintaan, yang memberikan fleksibilitas lebih besar kepada pengembang.
Keamanan selalu menjadi area fokus utama Google. Versi baru model ini semakin meningkatkan keamanan sambil mengikuti instruksi pengguna. Google juga telah mengubah pengaturan default filter untuk memberi pengembang lebih banyak otonomi.
Selain itu, Google juga meluncurkan versi perbaikan dari model eksperimental Gemini1.5Flash-8B, yang berkinerja baik dalam skenario aplikasi teks dan multimodal. Versi ini telah dirilis di Google AI Studio dan Gemini API, memberikan lebih banyak pilihan kepada pengembang.
Untuk pengguna Gemini Advanced, mereka akan segera dapat merasakan versi Gemini1.5Pro-002 yang dioptimalkan untuk obrolan.
Referensi: https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduksi-15-pro-pricing-increased-rate-limits-and-more/
Secara keseluruhan, peningkatan seri model Gemini 1.5 telah membawa manfaat besar bagi pengembang dan perusahaan AI. Biaya yang lebih rendah, kecepatan yang lebih tinggi, kinerja yang lebih bertenaga, dan pengalaman penggunaan yang lebih nyaman menunjukkan masa depan aplikasi AI yang lebih cerah. Editor Downcodes berharap dapat melihat penerapan luar biasa dari seri Gemini 1.5 di berbagai bidang!