Repo ini berisi kode untuk menyempurnakan model bahasa besar (LLM) dengan dataset kutipan terkenal.
Metode finetuning yang didukung adalah Deep -kecepatan, Lora, atau Qlora.
Awalnya, repo mengunduh dan mengonversi bobot model untuk GPTJ ketika belum ditambahkan ke paket transformator Huggingface. Kode itu masih dapat dilihat di bawah cabang original_youtube .
/quotes_dataset berisi dataset yang diformat dengan benar untuk disempurnakan. Lihat Repo untuk membuat dataset ini di sini
/finetuning_repo berisi kode yang berasal dari repo di sini yang telah saya modifikasi untuk bekerja dengan lebih banyak model dan dengan lebih banyak metode.
Jika membutuhkan bantuan profesional berbayar, itu tersedia melalui email ini
Lihat video lama untuk kode repo asli di sini untuk tutorial video.
Video yang lebih diperbarui untuk menggunakan model HuggingFace dapat dilihat di sini
Buka cabang original_youtube adalah Anda ingin melihat kode, tetapi saya sangat menyarankan Anda menggunakan metode yang lebih modern
Walkthrough yang diperbarui menggunakan Nvidia-Docker untuk mengeluarkan sakit kepala dari banyak proses.
Jika Anda memiliki sistem Linux 64-bit dan membutuhkan driver untuk A100, Anda dapat menjalankan perintah seperti ini untuk diatur.
wget https://us.download.nvidia.com/tesla/515.86.01/NVIDIA-Linux-x86_64-515.86.01.run
Anda kemudian akan menjalankan program yang diunduh dengan sudo.
chmod 777 NVIDIA-Linux-x86_64-515.86.01.run
sudo ./NVIDIA-Linux-x86_64-515.86.01.run
build_image.sh . Jika Anda menerima kesalahan tentang tidak dapat menemukan gambar Docker, perbarui ke versi CUDA yang lebih baru. Gambar -gambar itu secara berkala sudah usang. Kemudian buka PR sehingga Anda dapat memperbaiki masalah ini untuk orang lain. Membangun gambar Docker bisa memakan waktu banyak menit.run_image.sh . Skrip ini menjalankan gambar Docker yang baru saja dibangun dan memasang direktori saat ini ke /workspace di dalam wadah Docker. Semua GPU dalam sistem akan dilewati. Selain itu, untuk mencegah model mengunduh setiap kali wadah ini dijalankan, .cache Anda juga akan dilewati.