Di bidang kecerdasan buatan, teknologi yang mengganggu diam -diam muncul. Baru-baru ini, Inception Labs mengumumkan peluncuran serangkaian merkuri dari Model Bahasa Besar Difusi (DLLM), generasi baru model bahasa yang dirancang untuk menghasilkan teks berkualitas tinggi dengan cepat dan efisien. Dibandingkan dengan model bahasa besar autoregresif tradisional, Merkurius telah meningkatkan kecepatan generasi hingga 10 kali, memungkinkan lebih dari 1.000 penanda per detik pada kartu grafis NVIDIA H100, kecepatan yang sebelumnya dicapai hanya oleh chip khusus.

Mercury Coder, produk pertama dalam seri Mercury, telah diluncurkan dalam pengujian publik. Model ini berfokus pada pembuatan kode, menunjukkan kinerja yang sangat baik dan melampaui banyak model optimasi kecepatan yang ada dalam berbagai tolok ukur pemrograman, seperti GPT-4O Mini dan Claude3.5HauKu, sementara juga kecepatan hampir 10 kali lebih cepat. Menurut umpan balik pengembang, penyelesaian kode Mercury lebih populer. Dalam pengujian C Opilot Arena, Mini Coder Mercury berada di antara yang teratas dalam kinerja dan merupakan salah satu model tercepat.
Sebagian besar model bahasa saat ini mengadopsi autoregresi, yaitu, menghasilkan tag satu per satu dari kiri ke kanan, yang mengakibatkan proses pembuatan pasti berurutan, dengan biaya latensi dan perhitungan yang tinggi. Mercury menggunakan metode pembuatan "kasar hingga halus", mulai dari kebisingan murni, dan secara bertahap memperbaiki output setelah beberapa langkah "denoising". Ini memungkinkan model merkuri diproses secara paralel dengan banyak tag pada generasi, memungkinkan inferensi yang lebih baik dan respon terstruktur.
Dengan peluncuran seri Mercury, Inception Labs menunjukkan potensi besar model difusi di bidang teks dan pembuatan kode. Selanjutnya, perusahaan juga berencana untuk meluncurkan model bahasa yang cocok untuk aplikasi obrolan untuk memperluas skenario aplikasi model bahasa difusi. Model-model baru ini akan memiliki kemampuan proxy cerdas yang lebih kuat, mampu perencanaan yang kompleks dan generasi jangka panjang. Pada saat yang sama, efisiensinya membuatnya bekerja dengan baik pada perangkat yang dibatasi sumber daya, seperti smartphone dan laptop.
Secara keseluruhan, peluncuran Merkurius menandai kemajuan penting dalam teknologi kecerdasan buatan, tidak hanya meningkatkan kecepatan dan efisiensi, tetapi juga memberikan solusi berkualitas lebih tinggi untuk industri.
Pendahuluan Resmi: https://www.inseptionlabs.ai/news
Pengalaman Online: https://chat.ineSceptionlabs.ai/
Poin -Poin Kunci:
Serangkaian merkuri dari Model Bahasa Besar (DLLM) diluncurkan, dengan kecepatan generasi meningkat menjadi 1.000 penanda per detik.
Mercury Coder berfokus pada pembuatan kode dan mengungguli banyak model yang ada dalam pembandingan dan berkinerja baik.
Cara -cara inovatif dari model difusi membuat pembuatan teks lebih efisien dan akurat, memberikan kemungkinan baru untuk aplikasi proxy pintar.