Llama 2_Huggingface_4Bit_QLoRA تنزيل - Llama 2_Huggingface_4Bit

Llama 2_Huggingface_4Bit_QLoRA

كود الذكاء الاصطناعي

1.0.0

تنزيل

تحديث ملاحظة

يمكن العثور على نسخة محدثة في ريبو جديد

https://github.com/gmongaras/wizard_qlora_finetuning

llama-2_huggingface_4bit_qlora

مثال عاملة لنموذج 4Bit Qlora Falcon/Llama2

لبدء Finetuning ، تحرير وتشغيل main.py

بمجرد اكتمال التذمر ، يجب أن يكون لديك نقاط تفتيش في ./outputs . قبل تشغيل الاستدلال ، يمكننا الجمع بين أوزان Lora والأوزان الأصلية للاستدلال الأسرع ومتطلبات GPU الأصغر أثناء الاستدلال. للقيام بذلك ، قم بتشغيل البرنامج النصي merge_weights.py مع مساراتك.

أخيرًا ، يمكنك تشغيل generate.py على سبيل المثال الجيل بالنظر إلى النموذج المدمج.

متطلبات

توجد متطلبات Python لتشغيل البرنامج النصي في المتطلبات. txt

./llama-2 عليك أيضًا تنزيل أوزان Falcon https://huggingface.co/meta-llama/Llama-2-7b-hf 7B هنا https://huggingface.co/tiiuae/falcon-7b ووضع الملفات في دليل ./tiiuae/falcon-7b

وحدات معالجة الرسومات المتعددة

لا يدعم هذا البرنامج النصي GPUs متعدد على فنيه 4 بت. إذا وجدت طريقة للقيام بذلك ، فسوف أقوم بتحديث البرنامج النصي.

متطلبات GPU

يستغرق النموذج الأساسي حوالي 6 جيجابايت من الذاكرة.
يعتمد Finetuning على حجم المحول ، وحجم الدُفعة ، وطول الحد الأقصى ، وما إلى ذلك في التكوين الحالي ، يبلغ استخدام الذاكرة حوالي 8 جيجابايت.

مشاكل

إذا كان هناك خطأ في الشكل عند التدريب ، فإن BitsandBytes و/أو PEFT تواجه مشكلات. أفضل طريقة للتغلب على هذه المشكلة هي إلغاء تثبيتها بالكامل وإعادة تثبيتها من المصدر:

 python -m pip uninstall bitsandbytes transformers accelerate peft -y
python -m pip install git+https://github.com/huggingface/transformers.git git+https://github.com/huggingface/peft.git git+https://github.com/huggingface/accelerate.git git+https://github.com/timdettmers/bitsandbytes.git -U

إذا حصلت على CUDA Setup failed despite GPU being available. Please run the following command to get more information ، ثم تحتاج إلى إنشاء bitsandbytes من المصدر ووضعه في أجزاءك وبيتلك بوجود باتباع https://github.com/oobabooga/text-generation-webui/issues/147

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-07
الحجم 7.02KB
من Github

تطبيقات ذات صلة

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
محرك تحليل البيانات Lihua الإصدار المجاني 3.0_search_navigation_collection_public Oplic_ranking_api

2022-06-28

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل