Repositori ini berisi pekerjaan lab untuk kursus Coursera tentang "AI generatif dengan model bahasa besar".
Lakukan ringkasan dialog menggunakan AI generatif. Eksperimen dengan dalam pembelajaran konteks seperti nol tembakan, satu bidikan dan beberapa kesimpulan tembakan dan tune parameter konfigurasi terkait pada inferensi untuk mempengaruhi hasil.
Lakukan penyesuaian instruksi pada LLM yang ada dari memeluk wajah, model Flan-T5. Jelajahi metode penyempurnaan penuh serta metode PEFT (parameter efisien fine tuning) seperti LORA (adaptasi peringkat rendah) dan evaluasi menggunakan metrik rouge.
Selanjutnya tune model flan-t5 menggunakan pembelajaran penguatan dengan model hadiah seperti model ucapan kebencian meta ai untuk menghasilkan ringkasan yang kurang beracun. Gunakan Optimasi Kebijakan Proksimal (PPO) untuk menyempurnakan dan mendetoksifikasi model.