Pruna AI Meluncurkan Kerangka Optimasi Model Open Source AI untuk membantu kompresi yang efisien - artikel AI

Penulis：Eve Cole Waktu Pembaruan：2025-05-22 08:25:01

2025 Binance Direct

Pruna AI adalah startup dari Eropa yang berfokus pada pengembangan algoritma kompresi untuk model AI. Baru -baru ini, perusahaan mengumumkan bahwa mereka akan membuka sumber kerangka pengoptimalannya untuk membantu pengembang mengompres dan model AI lebih efisien.

Kerangka kerja yang dikembangkan oleh Pruna AI menggabungkan berbagai pendekatan efisiensi, termasuk caching, pemangkasan, kuantisasi dan distilasi, untuk meningkatkan kinerja model AI. Kerangka kerja ini tidak hanya membakukan penyimpanan dan pemuatan model kompresi, tetapi juga mengevaluasi model terkompresi untuk menentukan apakah kualitasnya telah turun secara signifikan saat mengukur peningkatan kinerja yang dibawa oleh kompresi.

"Kerangka kerja kami mirip dengan standardisasi Transformers dan Diffuser yang memeluk Face, dan kami menyediakan cara terpadu untuk memanggil dan menggunakan berbagai metode efisiensi," kata John Rachwan, co-founder dan chief technology officer Pruna AI. Perusahaan besar seperti OpenAI telah menerapkan beberapa metode kompresi dalam model mereka, seperti menggunakan distilasi untuk membuat versi yang lebih cepat dari model andalannya.

Distilasi adalah teknologi yang mengekstraksi pengetahuan melalui model "guru-siswa", di mana pengembang mengirim permintaan ke model guru dan merekam output. Output ini kemudian digunakan untuk melatih model siswa untuk memperkirakan perilaku model guru. Lahwan mencatat bahwa sementara banyak perusahaan besar cenderung membangun alat kompresi itu sendiri, di komunitas open source, solusi yang didasarkan pada satu metode tunggal sering hanya ditemukan, dan Pruna AI menyediakan alat yang mengintegrasikan banyak metode, sangat menyederhanakan proses penggunaan.

Saat ini, kerangka kerja PRUNA AI mendukung berbagai model, termasuk model bahasa besar, model difusi, model pengenalan suara, dan model visi komputer. Tetapi perusahaan saat ini berfokus pada optimalisasi model pembuatan gambar dan video. Perusahaan seperti skenario dan fotoroom telah menggunakan layanan PRUNA AI.

Selain versi open source, Pruna AI juga telah meluncurkan versi perusahaan yang mencakup fitur optimisasi canggih dan agen optimisasi. "Fitur paling menarik yang akan kami rilis adalah agen kompresi, di mana pengguna hanya perlu memberikan model dan mengatur persyaratan kecepatan dan akurasi, dan agen akan secara otomatis menemukan kombinasi kompresi terbaik."

Pruna AI membebankan biaya per jam, mirip dengan cara pengguna menyewa GPU pada layanan cloud. Dengan menggunakan model yang dioptimalkan, bisnis dapat menghemat banyak uang saat beralasan. Sebagai contoh, Pruna AI berhasil mengurangi ukuran model LLAMA delapan kali, dengan sedikit kehilangan akurasi. Perusahaan berharap bahwa pelanggan dapat melihat kerangka kerja kompresinya sebagai investasi yang pada akhirnya mendapatkan pengembalian.

Baru -baru ini, Pruna AI menyelesaikan pembiayaan benih $ 6,5 juta, dengan investor termasuk EQT Ventures, Daphni, Motier Ventures dan Kima Ventures.

Proyek: https://github.com/prunaai/pruna

Poin -Poin Kunci:

Pruna AI meluncurkan kerangka optimisasi open source yang menggabungkan beberapa metode kompresi untuk meningkatkan kinerja model AI.

Perusahaan besar sering menggunakan distilasi dan teknologi lainnya, dan Pruna AI menyediakan alat yang mengintegrasikan banyak metode untuk menyederhanakan proses penggunaan.

Perusahaan Edisi mendukung fitur -fitur canggih untuk membantu pengguna mencapai kompresi model dan peningkatan kinerja sambil mempertahankan akurasi.