LLM Finetuning Toolkit LLM Finetuning Toolkit DOWN DOWNOUDIN

LLM Finetuning Toolkit

ซอร์สโค้ดอื่น ๆ

v0.2.3

ดาวน์โหลด

LLM Finetuning Toolkit

ภาพรวม

LLM Finetuning Toolkit เป็นเครื่องมือ CLI ที่ใช้การกำหนดค่าสำหรับการเปิดตัวชุดการทดลองปรับแต่ง LLM ในข้อมูลของคุณและรวบรวมผลลัพธ์ จากไฟล์กำหนดค่า yaml เดียวควบคุมองค์ประกอบทั้งหมดของไปป์ไลน์การทดลองทั่วไป - พรอมต์ , LLM โอเพนซอร์ซ , กลยุทธ์การเพิ่มประสิทธิภาพ และ การทดสอบ LLM

การติดตั้ง

PIPX (แนะนำ)

PIPX ติดตั้งแพ็คเกจและการพึ่งพาในสภาพแวดล้อมเสมือนจริงแยกต่างหาก

pipx install llm-toolkit

ปิ๊ก

pip install llm-toolkit

เริ่มต้นอย่างรวดเร็ว

คู่มือนี้มี 3 ขั้นตอนที่จะช่วยให้คุณได้รับประโยชน์สูงสุดจากชุดเครื่องมือนี้!

พื้นฐาน : เรียกใช้การทดลองปรับแต่ง LLM ครั้งแรกของคุณ
Intermediate : เรียกใช้การทดลองที่กำหนดเองโดยการเปลี่ยนส่วนประกอบของไฟล์กำหนดค่า YAML
ขั้นสูง : ชุดเปิดการทดลองปรับแต่งอย่างละเอียดในเทมเพลตพรอมต์ที่แตกต่างกัน LLMS เทคนิคการเพิ่มประสิทธิภาพ-ทั้งหมดผ่านไฟล์การกำหนดค่า YAML หนึ่ง ไฟล์

ขั้นพื้นฐาน

llmtune generate config
llmtune run ./config.yml

คำสั่งแรกสร้างไฟล์ config.yml สตาร์ทเตอร์ที่เป็นประโยชน์และบันทึกในไดเรกทอรีการทำงานปัจจุบัน สิ่งนี้มีให้สำหรับผู้ใช้เพื่อเริ่มต้นอย่างรวดเร็วและเป็นฐานสำหรับการปรับเปลี่ยนเพิ่มเติม

จากนั้นคำสั่งที่สองจะเริ่มกระบวนการปรับแต่งอย่างละเอียดโดยใช้การตั้งค่าที่ระบุในไฟล์กำหนดค่า YAML config.yaml ค่าเริ่มต้น

ระดับกลาง

ไฟล์การกำหนดค่าเป็นชิ้นส่วนกลางที่กำหนดพฤติกรรมของชุดเครื่องมือ มันถูกเขียนขึ้นในรูปแบบ YAML และประกอบด้วยหลายส่วนที่ควบคุมแง่มุมต่าง ๆ ของกระบวนการเช่นการบริโภคข้อมูลคำจำกัดความของแบบจำลองการฝึกอบรมการอนุมานและการประกันคุณภาพ เราเน้นบางส่วนที่สำคัญ

ความสนใจแฟลช 2

เพื่อเปิดใช้งานความสนใจแบบแฟลชสำหรับรุ่นที่รองรับ ติดตั้ง flash-attn ก่อน:

pipx

pipx inject llm-toolkit flash-attn --pip-args=--no-build-isolation

ปิ๊ก

 pip install flash-attn --no-build-isolation

จากนั้นเพิ่มลงในไฟล์ config

 model :
  torch_dtype : " bfloat16 " # or "float16" if using older GPU
  attn_implementation : " flash_attention_2 "

การบริโภคข้อมูล

ตัวอย่างของการบริโภคข้อมูลอาจเป็นอย่างไร:

 data :
  file_type : " huggingface "
  path : " yahma/alpaca-cleaned "
  prompt :
    # ## Instruction: {instruction}
    # ## Input: {input}
    # ## Output:
  prompt_stub : { output }
  test_size : 0.1 # Proportion of test as % of total; if integer then # of samples
  train_size : 0.9 # Proportion of train as % of total; if integer then # of samples
  train_test_split_seed : 42

ในขณะที่ตัวอย่างข้างต้นแสดงให้เห็นว่าการใช้ชุดข้อมูลสาธารณะจากการกอดใบหน้าไฟล์กำหนดค่ายังสามารถนำข้อมูลของคุณเองได้

   file_type : " json "
   path : " <path to your data file>

   file_type : " csv "
   path : " <path to your data file>

ฟิลด์พรอมต์ช่วยสร้างคำแนะนำในการปรับแต่ง LLM มันอ่านข้อมูลจากคอลัมน์เฉพาะที่กล่าวถึงในวงเล็บ {} ที่มีอยู่ในชุดข้อมูลของคุณ ในตัวอย่างที่ให้ไว้คาดว่าไฟล์ข้อมูลจะมีชื่อคอลัมน์: instruction input และ output
ฟิลด์พรอมต์ใช้ทั้ง prompt และ prompt_stub ในระหว่างการปรับแต่ง อย่างไรก็ตามในระหว่างการทดสอบ เฉพาะ ส่วน prompt จะใช้เป็นอินพุตไปยัง LLM ที่ปรับแต่งอย่างละเอียด

คำจำกัดความ llm

 model :
  hf_model_ckpt : " NousResearch/Llama-2-7b-hf "
  quantize : true
  bitsandbytes :
    load_in_4bit : true
    bnb_4bit_compute_dtype : " bf16 "
    bnb_4bit_quant_type : " nf4 "

# LoRA Params -------------------
lora :
  task_type : " CAUSAL_LM "
  r : 32
  lora_dropout : 0.1
  target_modules :
    - q_proj
    - v_proj
    - k_proj
    - o_proj
    - up_proj
    - down_proj
    - gate_proj

ในขณะที่ตัวอย่างด้านบนแสดงโดยใช้ LLAMA2 7B ในทางทฤษฎี LLM โอเพนซอร์สที่รองรับโดยการกอดใบหน้าสามารถใช้ในชุดเครื่องมือนี้

 hf_model_ckpt : " mistralai/Mistral-7B-v0.1 "

 hf_model_ckpt : " tiiuae/falcon-7b "

พารามิเตอร์สำหรับ LORA เช่นอันดับ r และการออกกลางคันสามารถเปลี่ยนแปลงได้

 lora :
  r : 64
  lora_dropout : 0.25

การประกันคุณภาพ

 qa :
  llm_metrics :
    - length_test
    - word_overlap_test

เพื่อให้แน่ใจว่า LLM ที่ได้รับการปรับแต่งจะทำงานตามที่คาดไว้คุณสามารถเพิ่มการทดสอบที่ตรวจสอบว่าพฤติกรรมที่ต้องการนั้นได้รับการบรรลุหรือไม่ ตัวอย่าง: สำหรับการปรับแต่ง LLM สำหรับงานสรุปเราอาจต้องการตรวจสอบว่าบทสรุปที่สร้างขึ้นนั้นมีความยาวน้อยกว่าข้อความอินพุตหรือไม่ นอกจากนี้เรายังต้องการเรียนรู้การทับซ้อนระหว่างคำในข้อความต้นฉบับและสรุปที่สร้างขึ้น

เอาท์พุทสิ่งประดิษฐ์

การกำหนดค่านี้จะเรียกใช้การปรับแต่งอย่างละเอียดและบันทึกผลลัพธ์ภายใต้ไดเรกทอรี ./experiment/[unique_hash] การกำหนดค่าที่ไม่ซ้ำกันแต่ละครั้งจะสร้างแฮชที่ไม่ซ้ำกันเพื่อให้เครื่องมือของเราสามารถรับได้โดยอัตโนมัติ ตัวอย่างเช่นหากคุณต้องการออกในช่วงกลางของการฝึกอบรมโดยการเปิดตัวสคริปต์ใหม่โปรแกรมจะโหลดชุดข้อมูลที่มีอยู่โดยอัตโนมัติซึ่งถูกสร้างขึ้นภายใต้ไดเรกทอรีแทนที่จะทำซ้ำอีกครั้ง

หลังจากที่สคริปต์ทำงานเสร็จคุณจะเห็นสิ่งประดิษฐ์ที่แตกต่างเหล่านี้:

/dataset # generated pkl file in hf datasets format
/model # peft model weights in hf format
/results # csv of prompt, ground truth, and predicted values
/qa # csv of test results: e.g. vector similarity between ground truth and prediction

เมื่อการเปลี่ยนแปลงทั้งหมดได้รับการรวมอยู่ในไฟล์ YAML คุณสามารถใช้มันเพื่อเรียกใช้การทดลองปรับแต่งแบบกำหนดเอง!

python toolkit.py --config-path < path to custom YAML file >

ขั้นสูง

โดยทั่วไปแล้วเวิร์กโฟลว์การปรับจูนจะเกี่ยวข้องกับการศึกษาการระเหยใน LLMs ต่างๆการออกแบบที่รวดเร็วและเทคนิคการปรับให้เหมาะสม ไฟล์การกำหนดค่าสามารถเปลี่ยนแปลงได้เพื่อสนับสนุนการศึกษาการระเหย

ระบุเทมเพลตพรอมต์ที่แตกต่างกันเพื่อทดสอบในขณะที่ปรับแต่ง

 data :
  file_type : " huggingface "
  path : " yahma/alpaca-cleaned "
  prompt :
    - >-
      This is the first prompt template to iterate over
      ### Input: {input}
      ### Output:
    - >-
      This is the second prompt template
      ### Instruction: {instruction}
      ### Input: {input}
      ### Output:
  prompt_stub : { output }
  test_size : 0.1 # Proportion of test as % of total; if integer then # of samples
  train_size : 0.9 # Proportion of train as % of total; if integer then # of samples
  train_test_split_seed : 42

ระบุ LLM ต่างๆที่คุณต้องการทดสอบด้วย

 model :
  hf_model_ckpt :
    [
      " NousResearch/Llama-2-7b-hf " ,
      mistralai/Mistral-7B-v0.1",
      " tiiuae/falcon-7b " ,
    ]
  quantize : true
  bitsandbytes :
    load_in_4bit : true
    bnb_4bit_compute_dtype : " bf16 "
    bnb_4bit_quant_type : " nf4 "

ระบุการกำหนดค่าที่แตกต่างกันของ LORA ที่คุณต้องการจะลดลง

 lora :
  r : [16, 32, 64]
  lora_dropout : [0.25, 0.50]

การขยาย

ชุดเครื่องมือให้สถาปัตยกรรมแบบแยกส่วนและขยายได้ซึ่งช่วยให้นักพัฒนาสามารถปรับแต่งและปรับปรุงการทำงานเพื่อให้เหมาะกับความต้องการเฉพาะของพวกเขา แต่ละองค์ประกอบของชุดเครื่องมือเช่นการบริโภคข้อมูลการปรับแต่งการอนุมานและการทดสอบการประกันคุณภาพได้รับการออกแบบให้สามารถขยายได้ง่าย

การบริจาค

การบริจาคโอเพ่นซอร์สสำหรับชุดเครื่องมือนี้ยินดีต้อนรับและสนับสนุน หากคุณต้องการมีส่วนร่วมโปรดดูการสนับสนุน

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน v0.2.3
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-04-16
ขนาด 9.94MB
มาจาก Github

แอปที่เกี่ยวข้อง

webextension pixiv toolkit

2024-11-12
TensorRT LLM

2024-11-10
jsdoc_toolkit เวอร์ชัน 2.3.1

2022-05-31
jsdoc_toolkit v2.0.1 ข

2022-05-30
ชุดเครื่องมือ jsdoc

2009-05-24
jsdoc_toolkit

2009-05-11

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด