Finetuning beberapa model wizard dengan qlora
https://youtu.be/hkt5nz0buso?si=hnmylp_z5sgzlmbm
Finetuning dapat dilakukan dengan skrip finetune.py . Dalam skrip ini, model akan diunduh dan di-finetuned pada salah satu dataset dalam presisi 4-bit. Saat kemajuan finetuning sedang dibuat, pos pemeriksaan disimpan ke direktori output yang ditentukan.
Setelah model dilatih, salah satu file pos pemeriksaan harus digabungkan sehingga bobot Lora dan bobot lama digabungkan menjadi satu matriks berat, membuat inferensi lebih efisien daripada jika Anda membagi. merge.py melakukan gabungan yang diberikan file pos pemeriksaan yang ditentukan dan jenis model yang ditentukan.
Inferensi memiliki beberapa skrip. infer.py dan infer.ipynb serupa dan hanya menjalankan inferensi lurus pada model yang diberikan. infer_interface.ipynb memiliki antarmuka tambahan menggunakan gradio.
upload.py dapat digunakan untuk mengunggah model huggingface ke hub dengan mudah diberikan nama repo untuk diunggah. Pastikan untuk mendapatkan token write dari huggingface untuk mengunggah dengan benar.
data_creation.ipynb adalah contoh sederhana pembuatan data.