Proyek ini mengotomatiskan proses pemilihan model, permintaan, atau parameter inferensi terbaik untuk kasus penggunaan yang diberikan, memungkinkan Anda untuk mengulangi kombinasi mereka dan untuk memeriksa hasilnya secara visual.
Diasumsikan Ollama diinstal dan menyajikan titik akhir, baik di localhost atau di server jarak jauh.
Inilah yang merupakan percobaan untuk prompt sederhana, diuji pada 3 model yang berbeda, terlihat seperti:

(Untuk tampilan yang lebih mendalam pada proses evaluasi yang dibantu oleh alat ini, silakan periksa https://dezoito.github.io/2023/12/27/rust-ollama-grid-search.html).
Periksa halaman Rilis untuk proyek, atau di bilah sisi.
Secara teknis, istilah "pencarian grid" mengacu pada iterasi pada serangkaian hyperparam model yang berbeda untuk mengoptimalkan kinerja model, tetapi itu biasanya berarti parameter seperti batch_size , learning_rate , atau number_of_epochs , lebih umum digunakan dalam pelatihan.
Tapi konsepnya di sini serupa:
Mari kita tentukan pilihan model, kombinasi prompt dan beberapa parameter:

Prompt akan dikirimkan sekali untuk setiap nilai parameter, untuk masing -masing model yang dipilih, menghasilkan satu set respons.
Demikian pula, Anda dapat melakukan tes A/B dengan memilih model yang berbeda dan membandingkan hasil untuk kombinasi prompt/parameter yang sama, atau menguji permintaan yang berbeda di bawah konfigurasi yang sama:

Membandingkan hasil yang berbeda untuk model yang sama
Anda dapat menyimpan dan mengelola petunjuk Anda (kami ingin membuat prompt yang kompatibel dengan WebUI terbuka)

Anda dapat meminta secara otomatis dengan mengetik "/" (terinspirasi oleh webui terbuka, juga):

Anda dapat mendaftar, memeriksa, atau mengunduh eksperimen Anda:

Untuk bug yang jelas dan kesalahan ejaan, silakan dan kirimkan PR.
Jika Anda ingin mengusulkan fitur baru, mengubah fungsionalitas yang ada, atau mengusulkan sesuatu yang lebih kompleks, buka masalah untuk diskusi, sebelum menyelesaikan pekerjaan pada PR.
Pastikan Anda telah dipasang karat.
Klon Repositori (atau garpu)
git clone https://github.com/dezoito/ollama-grid-search.git
cd ollama-grid-searchPasang dependensi frontend.
cd < project root >
# I'm using bun to manage dependencies,
# but feel free to use yarn or npm
bun install Pastikan rust-analyzer dikonfigurasi untuk menjalankan Clippy saat memeriksa kode.
Jika Anda menjalankan vs code, tambahkan ini ke file settings.json Anda
{
...
"rust-analyzer.check.command" : " clippy " ,
}(Atau, lebih baik lagi, cukup gunakan file pengaturan yang disediakan dengan kode)
Jalankan aplikasi dalam mode pengembangan
cd < project root > /
bun tauri devAmbil secangkir kopi karena ini mungkin memakan waktu cukup lama.
Karya dan tesis berikut telah mengutip repositori ini:
Inouye, D & Lindo, L, & Lee, R & Allen, E; Ilmu Komputer dan Teknik Senior Tesis: Tuning Otomatis Terapan di Lora Hyperparameters Santa Clara University, 2024 https://scholarcommons.scu.edu/cgi/viewcontent.cgi?article=1271&context=cseng_senior
Terima kasih banyak untuk @Fabianlars, @peperroni21 dan @tomreidnz.