llama2 lora fine tuning Download - llama2 lora fine tuning Source Code Download

llama2 lora fine tuning

كود الذكاء الاصطناعي

1.0.0

تنزيل

طبقة LLAMA2 مع Lora و Deepspeed

قم بضبط طراز Llama-2-7b-Chat على اثنين من P100s (16g).

يعتمد مصدر البيانات تنسيق الألبكة ويتألف من مصدرين للبيانات: القطار والتحقق من الصحة.

1. متطلبات بطاقة الرسومات

ذاكرة الفيديو 16G وما فوق (P100 أو T4 وما فوق) ، كتل واحدة أو أكثر.

2. رمز المصدر استنساخ

git clone https://github.com/git-cloner/llama2-lora-fine-tuning
cd llama2-lora-fine-tuning

3. بيئة تعتمد على التثبيت

 # 创建虚拟环境
conda create -n llama2 python=3.9 -y
conda activate llama2
# 下载github.com上的依赖资源（需要反复试才能成功，所以单独安装）
export GIT_TRACE=1
export GIT_CURL_VERBOSE=1
pip install git+https://github.com/PanQiWei/AutoGPTQ.git -i https://pypi.mirrors.ustc.edu.cn/simple --trusted-host=pypi.mirrors.ustc.edu.cn
pip install git+https://github.com/huggingface/peft -i https://pypi.mirrors.ustc.edu.cn/simple
pip install git+https://github.com/huggingface/transformers -i https://pypi.mirrors.ustc.edu.cn/simple
# 安装其他依赖包
pip install -r requirements.txt -i https://pypi.mirrors.ustc.edu.cn/simple
# 验证bitsandbytes
python -m bitsandbytes

4. قم بتنزيل النموذج الأصلي

python model_download.py --repo_id daryl149/llama-2-7b-chat-hf

5. قم بتوسيع قائمة الكلمات الصينية

 # 使用了https://github.com/ymcui/Chinese-LLaMA-Alpaca.git的方法扩充中文词表
# 扩充完的词表在merged_tokenizes_sp（全精度）和merged_tokenizer_hf（半精度）
# 在微调时，将使用--tokenizer_name ./merged_tokenizer_hf参数
python merge_tokenizers.py 
  --llama_tokenizer_dir ./models/daryl149/llama-2-7b-chat-hf 
  --chinese_sp_model_file ./chinese_sp.model

6. وصف المعلمة الدقيقة

هناك العديد من المعلمات التي يمكن تعديلها:

المعلمة	يوضح	احصل على القيمة
load_in_bits	دقة النموذج	4 و 8. إذا كانت ذاكرة الفيديو لا تتفوق ، فحاول اختيار الدقة العالية 8.
block_size	الحد الأقصى لطول الرمز المميز	الاختيار الأول 2048 ، تجاوز الذاكرة ، 1024 ، 512 ، إلخ.
per_device_train_batch_size	عدد الدُفعات لكل بطاقة يتم تحميلها في كل مرة أثناء التدريب	طالما أن الذاكرة لا تفيض ، حاول الذهاب إلى الانتخابات العامة
per_device_eval_batch_size	عدد الدُفعات لكل بطاقة يتم تحميلها في كل مرة أثناء التقييم	طالما أن الذاكرة لا تفيض ، حاول الذهاب إلى الانتخابات العامة
يشمل	تسلسلات بطاقة الرسومات المستخدمة	على سبيل المثال ، قطعتان: مضيف محلي: 1،2 (لاحظ أن التسلسل ليس بالضرورة هو نفسه ما تراه Nvidia-SMI)
num_train_epochs	عدد جولات التدريب	3 جولات على الأقل

7. تعديل غرامة

chmod +x finetune-lora.sh
# 微调
./finetune-lora.sh
# 微调（后台运行）
pkill -9 -f finetune-lora
nohup ./finetune-lora.sh > train.log  2>&1 &
tail -f train.log

8. اختبار

CUDA_VISIBLE_DEVICES=0 python generate.py 
    --base_model ' ./models/daryl149/llama-2-7b-chat-hf ' 
    --lora_weights ' output/checkpoint-2000 ' 
    --load_8bit #不加这个参数是用的4bit

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-02
الحجم 20.48MB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل