Repositori ini menyediakan kerangka kerja untuk klasifikasi berbasis prompt menggunakan model bahasa pra-terlatih, dengan fokus pada tugas klasifikasi teks Persia. Ini termasuk skrip dan notebook untuk menghasilkan petunjuk, petunjuk penyempurnaan untuk klasifikasi, mengevaluasi hasil, dan menganalisis metrik kinerja model seperti skor F1, presisi, dan penarikan. Repositori ini juga mendukung pembelajaran K-Shot untuk meningkatkan kemampuan beradaptasi model dengan memasukkan contoh yang relevan.
Kode : Berisi kode inti dan buku catatan untuk pelatihan model, pembuatan cepat, dan evaluasi.
AYA-Colab.ipynb : Buku catatan utama untuk pelatihan dan penyesuaian petunjuk dengan model AYA di Colab.Classification_report.ipynb : Menghasilkan metrik klasifikasi, termasuk skor F1, presisi, dan penarikan kembali untuk pengaturan cepat yang berbeda.Creating_dataset.ipynb : Persiapan data dan pembuatan dataset untuk pembelajaran berbasis prompt.f1-calculation.py : skrip python untuk menghitung dan memvisualisasikan skor F1.news-aya-symbol-tuning.ipynb : Notebook untuk tuning berbasis simbol dengan model AYA untuk klasifikasi teks.news-aya-system-user-prompt.ipynb : Skrip untuk menghasilkan sistem dan petunjuk pengguna menggunakan model bahasa pra-terlatih.Symbol_tuning_aya.ipynb : Simbol tuning notebook untuk mengoptimalkan efektivitas cepat.Dataset : Berisi dataset yang digunakan untuk pelatihan dan evaluasi.
Prompt : Berisi templat prompt yang digunakan untuk berbagai tugas klasifikasi.
Slide : File dokumentasi dan presentasi yang menjelaskan pembelajaran dalam konteks, desain cepat, pembelajaran K-shot, dan penyetelan simbol.
In-Context Learning.pptx & In-Context Learning.pdf : Detail tentang penggunaan pembelajaran dalam konteks untuk penyetelan model.System-User Prompt Design.pptx & System-User Prompt Design.pdf : Panduan untuk Merancang Sistem dan Prompt Pengguna.Symbol Tuning.pptx & Symbol Tuning.pdf : Instruksi tentang menggunakan simbol tuning untuk meningkatkan kinerja yang cepat. Klon Repositori:
git clone https://github.com/ShayanSalehi81/BachelorProject
cd BachelorProjectPasang paket yang diperlukan:
pip install -r requirements.txtOtentikasi dengan wajah pelukan (jika perlu) dan instal perpustakaan tambahan:
huggingface-cli login --token YOUR_HUGGINGFACE_TOKEN Jalankan salah satu notebook atau skrip Python di direktori Codes untuk melakukan tugas seperti pembuatan dataset, penyetelan cepat, atau evaluasi.
Generator memuat model bahasa pra-terlatih, format meminta, dan menghasilkan prediksi. Skrip mendukung kuantisasi 4-bit untuk penggunaan memori yang efisien dan memanfaatkan petunjuk yang disediakan pengguna untuk mengklasifikasikan data berita Persia sebagai "penting" atau "tidak penting."news-aya-symbol-tuning.ipynb dan Symbol_tuning_aya.ipynb dirancang untuk menyempurnakan simbol prompt, yang dapat meningkatkan interpretabilitas model dan konsistensi respons. Tuning simbol memperkenalkan penyesuaian kecil pada petunjuk, meningkatkan pemahaman model tentang kueri yang bernuansa. Creating_dataset.ipynb untuk preprocess dan memformat dataset Anda.news-aya-system-user-prompt.ipynb untuk mendefinisikan sistem dan prompt pengguna, dan menjalankan klasifikasi pada dataset.Classification_report.ipynb untuk menghitung metrik seperti akurasi dan skor F1 dan f1-calculation.py untuk memvisualisasikan kinerja.news-aya-symbol-tuning.ipynb untuk memperbaiki desain cepat dengan simbol tuning. Proyek ini dilisensikan di bawah lisensi MIT.
Kontribusi dipersilakan! Jangan ragu untuk mengirimkan masalah, permintaan fitur, atau permintaan menarik untuk meningkatkan proyek ini.