Shusen Puyu 2.5—-Interternlm2.5-7b Model mengumumkan dukungan open source untuk memproses artikel panjang jutaan kata-artikel AI

Penulis：Eve Cole Waktu Pembaruan：2025-02-22 07:25:02

Pada 3 Juli 2024, Laboratorium Kecerdasan Buatan Shanghai bergandengan tangan dengan sensetime, bersama -sama merilis generasi baru model bahasa besar - Cendekia Puyu 2.5 (Internlm2.5). Rilis ini menandai langkah penting dalam inovasi teknologi China di bidang kecerdasan buatan, terutama dalam penelitian dan penerapan model bahasa besar.

Model internlm2.5-7b telah secara resmi open source, dan model skala lainnya akan dibuka untuk umum satu demi satu. Laboratorium Intelijen Buatan Shanghai berjanji untuk terus memberikan lisensi komersial gratis dan mendukung inovasi dan pengembangan komunitas global melalui model open source berkualitas tinggi. Langkah ini tidak hanya menurunkan ambang aplikasi teknologi kecerdasan buatan, tetapi juga memberikan peluang yang lebih inovatif bagi pengembang global.

微信截图_20240708083247.png

Internlm2.5 telah mencapai peningkatan yang signifikan dalam beberapa bidang utama. Pertama, kemampuan inferensi telah ditingkatkan secara signifikan, dan kinerja beberapa dimensi bahkan melampaui model LLAMA3-70B. Terutama pada matematika evaluasi matematika, internlm2.5 mencapai peningkatan kinerja 100% dan memiliki akurasi 60%, yang sebanding dengan versi GPT-4 Turbo 1106. Kemajuan terobosan ini menyediakan alat yang lebih kuat untuk menyelesaikan masalah yang kompleks.

Kedua, Internlm2.5 mendukung kemampuan pemrosesan konteks hingga 1 juta token dan dapat memproses artikel panjang sekitar 1,2 juta karakter Cina. Dengan meningkatkan panjang konteks dan data sintetis, model ini dioptimalkan untuk pemahaman dokumen yang panjang dan interaksi agen, membuatnya lebih berguna saat berhadapan dengan teks yang kompleks.

Selain itu, internlm2.5 juga memiliki kemampuan untuk merencanakan dan memanggil alat secara mandiri. Ini dapat mencari dan mengintegrasikan informasi dari ratusan halaman web, dan mensimulasikan proses berpikir manusia melalui kerangka kerja multi-agen MindSearch untuk secara efektif mengintegrasikan informasi jaringan. Fungsi ini memberikan solusi baru untuk pengambilan informasi dan integrasi pengetahuan, sangat meningkatkan kepraktisan dan kecerdasan model.

Pengembang dapat memperoleh lebih banyak informasi dan sumber daya tentang internlm2.5 melalui tautan berikut:

Tautan Github: https://github.com/internlm/internlm

Tautan Model: https://www.modelscope.cn/models/shanghai_ai_laboratory/internlm2_5-7b-cat

Sarjana Puyu Beranda: https://internlm.intern-ai.org.cn/