Model bahasa besar mahal dan raksasa yang lambat, dan mengevaluasinya pada kumpulan data modern raksasa hanya membuatnya lebih buruk.
Kalau saja ada cara untuk hanya memilih subset yang bermakna ( dan kecil ) dari korpus dan mendapatkan evaluasi yang sangat akurat .....
Tunggu, terdengar seperti optimasi Bayesian!
Bocoel bekerja dalam langkah -langkah berikut:
Evaluasi yang dihasilkan mudah dikelola oleh utilitas manajer yang disediakan.
Sepengetahuan kami, ini adalah pekerjaan pertama yang bertujuan untuk mengurangi biaya perhitungan selama evaluasi (benchmarking) dengan anggaran (mungkin dinamis).
GPT2 , Pythia , LLAMA dan Lainnya Melalui Integrasi dengan Transformator dan Dataset HuggingfaceSeperti apa yang kamu lihat? Harap pertimbangkan untuk memberikan bintang ini (★)!
Sederhananya, optimasi Bayesian bertujuan untuk mengoptimalkan tujuan eksplorasi (area ungu dalam gambar) atau objek eksploitasi (ketinggian titik -titik hitam). Ini menggunakan proses Gaussian sebagai tulang punggung untuk inferensi, dan menggunakan fungsi akuisisi untuk memutuskan di mana harus mencicipi selanjutnya. Lihat di sini untuk pengantar yang lebih mendalam.
Karena optimasi Bayesian bekerja dengan baik dengan model black-box yang mahal untuk dievaluasi (parafrase: LLM) , itu sempurna untuk kasus penggunaan khusus ini. Bocoel menggunakan optimasi Bayesian sebagai tulang punggung untuk menjelajahi ruang embedding yang diberikan oleh korpus kami, yang memungkinkannya untuk memilih subset yang baik yang bertindak sebagai snapshot mini dari korpus.
LLM sangat lambat, terutama yang generatif (yang biasanya disebut sebagai LLM), karena generasi urutan pada dasarnya berurutan.
Terlepas dari persyaratan bocoel untuk menggunakan embedder untuk menyandikan seluruh korpus, embedders lebih cepat dari LLMS dengan pesanan besarnya dan waktu diperoleh kembali dengan hampir setiap penghematan dalam mengevaluasi LLMS.
Saya tidak ingin dependensi opsional:
pip install bocoel
Beri saya pengalaman penuh (semua dependensi opsional):
pip install "bocoel[all]"
Lihat Contoh Folder/Geting_Started untuk penggunaan Perpustakaan yang sederhana untuk memulai dengan hanya beberapa baris kode.
Contoh penggunaan berada di bawah examples folder. Referensi API dapat ditemukan di sini.
Kontributor Wanted! Jangan malu. Jangan ragu untuk mengajukan masalah dan PR. Untuk PR, silakan ikuti panduan tentang Kontribusi dan Kode Etik. Keterbukaan dan inklusif ditanggapi dengan sangat serius.
Kode ini tersedia di bawah lisensi BSD-3.
Jika Anda menemukan proyek ini bermanfaat dalam penelitian Anda, silakan kutip pekerjaan ini di
@misc{bocoel2024,
title = {BoCoEL: Bayesian Optimization as a Coverage Tool for Evaluating Large Language Models},
url = {https://bocoel.rentruewang.com/research/},
author = {Wang, RenChu},
month = {January},
year = {2024}
}