LLM Finetuning Toolkit Download - LLM Finetuning Toolkit Code Download

LLM Finetuning Toolkit

شفرة المصدر الأخرى

v0.2.3

تنزيل

LLM Finetuning Toolkit

ملخص

LLM FinetUning Toolkit هي أداة CLI قائمة على التكوين لإطلاق سلسلة من تجارب صقل LLM على بياناتك وجمع نتائجها. من ملف تكوين yaml واحد ، تتحكم في جميع عناصر خط أنابيب التجريب النموذجي - المطالبات ، LLMS مفتوحة المصدر ، استراتيجية التحسين واختبار LLM .

تثبيت

PIPX (موصى بها)

يقوم PIPX بتثبيت الحزمة والتبعيات في بيئة افتراضية منفصلة

pipx install llm-toolkit

pip

pip install llm-toolkit

بداية سريعة

يحتوي هذا الدليل على 3 مراحل ستمكنك من الحصول على أقصى استفادة من مجموعة الأدوات هذه!

BASIC : قم بتشغيل أول تجربة صقل LLM الخاصة بك
المتوسط : قم بتشغيل تجربة مخصصة عن طريق تغيير مكونات ملف تكوين YAML
متقدم : سلسلة إطلاق تجارب صقلها عبر قوالب موجهة مختلفة ، LLMS ، تقنيات التحسين-كل ذلك من خلال ملف تكوين YAML واحد

أساسي

llmtune generate config
llmtune run ./config.yml

يقوم الأمر الأول بإنشاء ملف config.yml مفيد ويحفظ في دليل العمل الحالي. يتم توفير ذلك للمستخدمين للبدء بسرعة وكقاعدة لمزيد من التعديل.

ثم يبدأ الأمر الثاني في عملية الضبط باستخدام الإعدادات المحددة في ملف تكوين YAML الافتراضي config.yaml .

متوسط

ملف التكوين هو القطعة المركزية التي تحدد سلوك مجموعة الأدوات. إنه مكتوب بتنسيق YAML ويتألف من عدة أقسام تتحكم في جوانب مختلفة من العملية ، مثل ابتلاع البيانات ، وتعريف النموذج ، والتدريب ، والاستدلال ، وضمان الجودة. نسلط الضوء على بعض الأقسام الحرجة.

فلاش الانتباه 2

لتمكين الاهتمام الفلاش للنماذج المدعومة. أول تثبيت flash-attn :

PIPX

pipx inject llm-toolkit flash-attn --pip-args=--no-build-isolation

pip

 pip install flash-attn --no-build-isolation

ثم ، أضف إلى ملف التكوين.

 model :
  torch_dtype : " bfloat16 " # or "float16" if using older GPU
  attn_implementation : " flash_attention_2 "

ابتلاع البيانات

مثال على شكل ابتلاع البيانات:

 data :
  file_type : " huggingface "
  path : " yahma/alpaca-cleaned "
  prompt :
    # ## Instruction: {instruction}
    # ## Input: {input}
    # ## Output:
  prompt_stub : { output }
  test_size : 0.1 # Proportion of test as % of total; if integer then # of samples
  train_size : 0.9 # Proportion of train as % of total; if integer then # of samples
  train_test_split_seed : 42

بينما يوضح المثال أعلاه باستخدام مجموعة بيانات عامة من Hugging Face ، يمكن لملف التكوين أيضًا تناول بياناتك الخاصة.

   file_type : " json "
   path : " <path to your data file>

   file_type : " csv "
   path : " <path to your data file>

تساعد الحقول المطالبة في إنشاء إرشادات لضبط LLM. يقرأ البيانات من أعمدة محددة ، المذكورة في قوسين {} ، موجودة في مجموعة البيانات الخاصة بك. في المثال المقدم ، من المتوقع أن يحتوي ملف البيانات على أسماء الأعمدة: instruction input output .
تستخدم الحقول المطالبة كلاً من prompt و prompt_stub أثناء الضبط. ومع ذلك ، أثناء الاختبار ، يتم استخدام قسم prompt فقط كمدخلات إلى LLM المضبوطة.

تعريف LLM

 model :
  hf_model_ckpt : " NousResearch/Llama-2-7b-hf "
  quantize : true
  bitsandbytes :
    load_in_4bit : true
    bnb_4bit_compute_dtype : " bf16 "
    bnb_4bit_quant_type : " nf4 "

# LoRA Params -------------------
lora :
  task_type : " CAUSAL_LM "
  r : 32
  lora_dropout : 0.1
  target_modules :
    - q_proj
    - v_proj
    - k_proj
    - o_proj
    - up_proj
    - down_proj
    - gate_proj

بينما يعرض المثال أعلاه باستخدام LLAMA2 7B ، من الناحية النظرية ، يمكن استخدام أي LLM مفتوح المصدر المدعوم من وجه المعانقة في مجموعة الأدوات هذه.

 hf_model_ckpt : " mistralai/Mistral-7B-v0.1 "

 hf_model_ckpt : " tiiuae/falcon-7b "

يمكن تغيير المعلمات الخاصة بـ Lora ، مثل Rann r و Strped.

 lora :
  r : 64
  lora_dropout : 0.25

ضمان الجودة

 qa :
  llm_metrics :
    - length_test
    - word_overlap_test

لضمان سلوك LLM الذي تم ضبطه كما هو متوقع ، يمكنك إضافة اختبارات تتحقق مما إذا كان يتم تحقيق السلوك المطلوب. على سبيل المثال: بالنسبة إلى LLM تم ضبطه بشكل جيد لمهمة تلخيص ، فقد نرغب في التحقق مما إذا كان الملخص الذي تم إنشاؤه أصغر بالفعل من نص الإدخال. نود أيضًا أن نتعلم التداخل بين الكلمات في النص الأصلي والملخص الذي تم إنشاؤه.

مخرجات قطعة أثرية

سيتم تشغيل هذا التكوين بشكل دقيق ويحفظ النتائج ضمن الدليل ./experiment/[unique_hash] سيقوم كل تكوين فريد بإنشاء تجزئة فريدة من نوعها ، بحيث يمكن لأداةنا التلقائي تلقائيًا من حيث توقفت. على سبيل المثال ، إذا كنت بحاجة إلى الخروج في منتصف التدريب ، من خلال إعادة إطلاق البرنامج النصي ، فسيقوم البرنامج تلقائيًا بتحميل مجموعة البيانات الموجودة التي تم إنشاؤها تحت الدليل ، بدلاً من القيام بذلك مرة أخرى.

بعد انتهاء البرنامج النصي ، سترى هذه القطع الأثرية المميزة:

/dataset # generated pkl file in hf datasets format
/model # peft model weights in hf format
/results # csv of prompt, ground truth, and predicted values
/qa # csv of test results: e.g. vector similarity between ground truth and prediction

بمجرد دمج جميع التغييرات في ملف YAML ، يمكنك ببساطة استخدامه لتشغيل تجربة صقل مخصصة!

python toolkit.py --config-path < path to custom YAML file >

متقدم

عادةً ما تتضمن مهام سير العمل الدقيقة تشغيل دراسات الاجتثاث عبر مختلف LLMs والتصميمات السريعة وتقنيات التحسين. يمكن تغيير ملف التكوين لدعم تشغيل دراسات الاجتثاث.

حدد قوالب مطالبة مختلفة للتجربة مع صقلها.

 data :
  file_type : " huggingface "
  path : " yahma/alpaca-cleaned "
  prompt :
    - >-
      This is the first prompt template to iterate over
      ### Input: {input}
      ### Output:
    - >-
      This is the second prompt template
      ### Instruction: {instruction}
      ### Input: {input}
      ### Output:
  prompt_stub : { output }
  test_size : 0.1 # Proportion of test as % of total; if integer then # of samples
  train_size : 0.9 # Proportion of train as % of total; if integer then # of samples
  train_test_split_seed : 42

حدد LLMs المختلفة التي ترغب في تجربتها.

 model :
  hf_model_ckpt :
    [
      " NousResearch/Llama-2-7b-hf " ,
      mistralai/Mistral-7B-v0.1",
      " tiiuae/falcon-7b " ,
    ]
  quantize : true
  bitsandbytes :
    load_in_4bit : true
    bnb_4bit_compute_dtype : " bf16 "
    bnb_4bit_quant_type : " nf4 "

حدد تكوينات مختلفة لـ Lora التي ترغب في تجهيزها.

 lora :
  r : [16, 32, 64]
  lora_dropout : [0.25, 0.50]

تمتد

توفر مجموعة الأدوات بنية معيارية وقابلة للتمديد تتيح للمطورين تخصيص وظائفها وتعزيزها لتناسب احتياجاتهم الخاصة. تم تصميم كل مكون من مكونات مجموعة الأدوات ، مثل ابتلاع البيانات ، والضبط ، والاستدلال ، واختبار ضمان الجودة ، ليكون قابلاً للتمديد بسهولة.

المساهمة

المساهمات المفتوحة في مجموعة الأدوات هذه موضع ترحيب وتشجيع. إذا كنت ترغب في المساهمة ، يرجى الاطلاع على المساهمة.

يوسع

معلومات إضافية

الإصدار v0.2.3
النوع شفرة المصدر الأخرى
وقت التحديث 2025-04-16
الحجم 9.94MB
من Github

تطبيقات ذات صلة

webextension pixiv toolkit

2024-11-12
TensorRT LLM

2024-11-10
jsdoc_toolkit v2.3.1

2022-05-31
jsdoc_toolkit v2.0.1 ب

2022-05-30
مجموعة أدوات jsdoc

2009-05-24
jsdoc_toolkit

2009-05-11

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل