Llama 2_Huggingface_4Bit_QLoRA Unduh - Llama 2_Huggingface_4Bit

Llama 2_Huggingface_4Bit_QLoRA

Kode Sumber AI

1.0.0

Unduh

Perbarui Catatan

Versi yang diperbarui dapat ditemukan dalam repo baru

https://github.com/gmongaras/wizard_qlora_finetuning

Llama-2_huggingface_4bit_qlora

Contoh kerja model 4bit Qlora Falcon/Llama2 menggunakan Huggingface

Untuk memulai finetuning, edit dan jalankan main.py

Setelah finetuning selesai, Anda harus memiliki pos pemeriksaan di ./outputs . Sebelum menjalankan inferensi, kita dapat menggabungkan bobot LORA dengan bobot asli untuk inferensi yang lebih cepat dan persyaratan GPU yang lebih kecil selama inferensi. Untuk melakukan ini, jalankan skrip merge_weights.py dengan jalur Anda.

Akhirnya, Anda dapat menjalankan generate.py misalnya generasi mengingat model gabungan.

Persyaratan

Persyaratan Python untuk menjalankan skrip terletak di persyaratan.txt

Anda juga harus mengunduh bobot Falcon dari model https://huggingface.co/meta-llama/Llama-2-7b-hf di sini https://huggingface.co/tiiuae/falcon-7b dan menempatkan file-file tersebut di ./llama-2 ./tiiuae/falcon-7b

Gpus berganda

Skrip ini tidak mendukung multi-GPU pada finetuning 4-bit. Jika saya menemukan cara untuk melakukan ini, saya akan memperbarui skrip.

Persyaratan GPU

Model dasar membutuhkan sekitar 6 GB memori.
Finetuning tergantung pada ukuran adaptor, ukuran batch, panjang maksimum, dll. Dalam konfigurasi saat ini, penggunaan memori sekitar 8GB.

Masalah

Jika ada kesalahan bentuk saat pelatihan, maka Bitsandbytes dan/atau Peft mengalami masalah. Cara terbaik untuk mengatasi masalah ini adalah dengan sepenuhnya menghapus mereka dan menginstal ulang mereka dari sumbernya:

 python -m pip uninstall bitsandbytes transformers accelerate peft -y
python -m pip install git+https://github.com/huggingface/transformers.git git+https://github.com/huggingface/peft.git git+https://github.com/huggingface/accelerate.git git+https://github.com/timdettmers/bitsandbytes.git -U

Jika Anda mendapatkan kesalahan CUDA Setup failed despite GPU being available. Please run the following command to get more information , maka Anda perlu membangun bitsandbytes dari sumber dan memasukkannya ke dalam bit dan byte-byte dengan mengikuti https://github.com/oobabooga/text-generation-webui/issues/147

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-07
ukuran 7.02KB
Berasal dari Github

Aplikasi Terkait

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Mesin analisis data Lihua versi gratis 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua