ดาวน์โหลด ms swift - ดาวน์โหลดซอร์สโค้ด ms swift

Swift (โครงสร้างพื้นฐานที่มีน้ำหนักเบาปรับขนาดได้สำหรับการปรับแต่ง)

เว็บไซต์ ModelsCope Community
中文ภาษาอังกฤษ

กระดาษ ｜ เอกสารภาษาอังกฤษ ｜中文文档

swift2.x en doc ｜ swift2.x 中文文档

สารบัญ

กลุ่ม
การแนะนำ
ข่าว
การติดตั้ง
เริ่มต้นอย่างรวดเร็ว
การใช้งาน
ใบอนุญาต
การอ้างอิง

☎กลุ่ม

คุณสามารถติดต่อเราและสื่อสารกับเราได้โดยเพิ่มกลุ่มของเรา:

กลุ่ม Discord	กลุ่ม WeChat

การแนะนำ

- MS-SWIFT เป็นกรอบการทำงานอย่างเป็นทางการที่จัดทำโดยชุมชน ModelsCope สำหรับการปรับแต่งและปรับใช้รูปแบบภาษาขนาดใหญ่และรุ่นขนาดใหญ่หลายรูปแบบ ปัจจุบันรองรับการฝึกอบรม (การฝึกอบรมก่อนการปรับแต่งการจัดตำแหน่งของมนุษย์) การอนุมานการประเมินผลการหาปริมาณและการปรับใช้โมเดลขนาดใหญ่ 400+ รุ่นและโมเดลขนาดใหญ่หลายรุ่น แบบจำลองภาษาขนาดใหญ่ (LLMS) เหล่านี้รวมถึงรุ่นเช่น QWEN2.5, LLAMA3.3, GLM4, InternLM2.5, Yi1.5, Mistral, Deepseek2.5, Baichuan2, Gemma2 และ Telechat2 LLM แบบหลายรูปแบบรวมถึงรุ่นเช่น QWEN2-VL, QWEN2-AUDIO, LLAMA3.2-Vision, LLAVA, InternVL2.5, MINICPM-V-2.6, GLM4V, XCOMPOSER2.5, YI-VL, DEEPSEEK-VL2, Phi3.5-Vision

- นอกจากนี้ MS-Swift ยังรวบรวมเทคโนโลยีการฝึกอบรมล่าสุด ได้แก่ Lora, Qlora, Llama-Pro, Longlora, Galore, Q-Galore, Lora+, Lisa, Dora, Fourierft, Reft, Unsloth และ Liger MS-Swift รองรับการเร่งความเร็วของการอนุมานการประเมินผลและโมดูลการปรับใช้โดยใช้ VLLM และ LMDEploy และรองรับการหาปริมาณของแบบจำลองขนาดใหญ่และโมเดลขนาดใหญ่หลายโมเดลโดยใช้เทคโนโลยีเช่น GPTQ, AWQ และ BNB เพื่อช่วยให้นักวิจัยและนักพัฒนาปรับแต่งและใช้โมเดลขนาดใหญ่ได้ง่ายขึ้น MS-Swift ยังให้อินเทอร์เฟซ Web-UI ที่ใช้ Gradio และแนวทางปฏิบัติที่ดีที่สุด

ทำไมต้องเลือก MS-Swift?

- ประเภทของรุ่น : รองรับโมเดลภาษาขนาดใหญ่ 400+ รุ่นและ รุ่นขนาดใหญ่หลายโมเดลมากกว่าหลายโมเดล และแบบจำลองทุกรุ่น ให้บริการโซลูชั่นที่ครอบคลุมตั้งแต่การฝึกอบรมไปจนถึงการปรับใช้
ประเภทชุดข้อมูล : มาพร้อมกับการฝึกอบรมล่วงหน้า 150+ การปรับแต่งการจัดตำแหน่งมนุษย์ชุดข้อมูลหลายรูปแบบและรองรับชุดข้อมูลที่กำหนดเอง
การสนับสนุนฮาร์ดแวร์ : เข้ากันได้กับ CPU, RTX Series, T4/V100, A10/A100/H100, Ascend NPU ฯลฯ
- การฝึกอบรมที่มีน้ำหนักเบา : รองรับวิธีการปรับแต่งน้ำหนักเบาเช่น Lora, Qlora, Dora, Lora+, REFT, RS-LORA, Llamapro, อะแดปเตอร์, มากมาย, Q-Galore, Lisa, Unsloth, Liger-Kernel
การฝึกอบรมแบบกระจาย : รองรับข้อมูลแบบกระจายแบบขนาน (DDP), DEVICE_MAP แบบจำลองแบบง่ายแบบจำลองแบบง่าย ๆ , DeepSpeed ZERO2/ZERO3, FSDP และเทคนิคการฝึกอบรมแบบกระจายอื่น ๆ
การฝึกอบรมเชิงปริมาณ : สนับสนุนการฝึกอบรมแบบจำลองเชิงปริมาณเช่น BNB, AWQ, GPTQ, AQLM, HQQ, EETQ
การฝึกอบรม RLHF : สนับสนุนวิธีการฝึกอบรมการจัดตำแหน่งมนุษย์เช่น DPO, CPO, SIMPO, ORPO, KTO, RM สำหรับทั้งข้อความบริสุทธิ์และโมเดลขนาดใหญ่หลายรูปแบบ
- การฝึกอบรมหลายรูปแบบ : สนับสนุนการฝึกอบรมเกี่ยวกับรังสีที่แตกต่างกันเช่นรูปภาพวิดีโอและเสียงสำหรับงานเช่น VQA, คำบรรยายภาพ, OCR และการต่อสายดิน
การฝึกอบรมอินเทอร์เฟซ : ให้ความสามารถสำหรับการฝึกอบรมการอนุมานการประเมินผลการหาปริมาณผ่านอินเตอร์เฟสเสร็จสิ้นไปป์ไลน์โมเดลขนาดใหญ่ทั้งหมด
ปลั๊กอินและส่วนขยาย : รองรับโมเดลและชุดข้อมูลที่กำหนดเองรวมถึงการปรับแต่งส่วนประกอบต่างๆเช่นการสูญเสีย, ตัวชี้วัด, เทรนเนอร์, ระดับการสูญเสีย, การโทรกลับ, Optimizer
- ความสามารถในกล่องเครื่องมือ : ไม่เพียง แต่ให้การสนับสนุนการฝึกอบรมสำหรับรุ่นขนาดใหญ่และโมเดลขนาดใหญ่แบบหลายรูปแบบ แต่ยังครอบคลุมกระบวนการทั้งหมดของการอนุมานการประเมินผลการหาปริมาณและการปรับใช้
การเร่งความเร็วการอนุมาน : รองรับเอ็นจิ้นการเร่งความเร็วเช่น Pytorch, VLLM, LMDeploy และให้ OpenAI API สำหรับการอนุมานเร่งการปรับใช้และโมดูลการประเมินผล
การประเมินแบบจำลอง : ใช้ evalscope เป็นแบ็กเอนด์การประเมินผลและรองรับการประเมินผลในชุดข้อมูล 100+ สำหรับทั้งข้อความบริสุทธิ์และแบบจำลองหลายโมเดล
การหาปริมาณแบบจำลอง : รองรับการส่งออก AWQ, GPTQ และ BNB ด้วยแบบจำลองที่สามารถใช้ VLLM/LMDeploy สำหรับการเร่งความเร็วและการฝึกอบรมต่อไป

- ข่าว

- 2024.12.04: อัปเดตเวอร์ชันหลัก SWIFT3.0 โปรดตรวจสอบบันทึกการเปิดตัวและการเปลี่ยนแปลง
- 2024.08.12: กระดาษ Swift ได้รับการเผยแพร่บน Arxiv และคุณสามารถอ่านได้ที่นี่
2024.08.05: สนับสนุนการใช้ Evalscope เป็นแบ็กเอนด์สำหรับการประเมินโมเดลขนาดใหญ่และแบบจำลองหลายรูปแบบ
2024.07.29: รองรับการใช้ VLLM และ LMDEPOLED เพื่อเร่งการอนุมานสำหรับรุ่นขนาดใหญ่และรุ่นหลายรูปแบบ เมื่อดำเนินการอนุมาน/ปรับใช้/ประเมินคุณสามารถระบุ --infer_backend vllm/lmdeploy
2024.07.24: สนับสนุนการฝึกอบรมการจัดตำแหน่งการตั้งค่าของมนุษย์สำหรับรุ่นใหญ่หลายรูปแบบรวมถึง DPO/ORPO/SIMPO/CPO/KTO/RM
2024.02.01: สนับสนุนการฝึกอบรมตัวแทน! อัลกอริทึมการฝึกอบรมมาจากบทความนี้

การติดตั้ง

ในการติดตั้งโดยใช้ PIP:

pip install ms-swift -U

เพื่อติดตั้งจากแหล่งที่มา:

 # pip install git+https://github.com/modelscope/ms-swift.git

git clone https://github.com/modelscope/ms-swift.git
cd ms-swift
pip install -e .

เริ่มต้นอย่างรวดเร็ว

10 นาทีของการปรับแต่งตนเองของ QWEN2.5-7B-Instruct ใน 3090 GPU เดียว:

อินเตอร์เฟสบรรทัดคำสั่ง

 # 22GB
CUDA_VISIBLE_DEVICES=0 
swift sft 
    --model Qwen/Qwen2.5-7B-Instruct 
    --train_type lora 
    --dataset ' AI-ModelScope/alpaca-gpt4-data-zh#500 ' 
              ' AI-ModelScope/alpaca-gpt4-data-en#500 ' 
              ' swift/self-cognition#500 ' 
    --torch_dtype bfloat16 
    --num_train_epochs 1 
    --per_device_train_batch_size 1 
    --per_device_eval_batch_size 1 
    --learning_rate 1e-4 
    --lora_rank 8 
    --lora_alpha 32 
    --target_modules all-linear 
    --gradient_accumulation_steps 16 
    --eval_steps 50 
    --save_steps 50 
    --save_total_limit 2 
    --logging_steps 5 
    --max_length 2048 
    --output_dir output 
    --system ' You are a helpful assistant. ' 
    --warmup_ratio 0.05 
    --dataloader_num_workers 4 
    --model_author swift 
    --model_name swift-robot

หลังจากการฝึกอบรมเสร็จสมบูรณ์ให้ใช้คำสั่งต่อไปนี้เพื่อทำการอนุมานกับน้ำหนักที่ผ่านการฝึกอบรม ตัวเลือก --adapters ควรถูกแทนที่ด้วยโฟลเดอร์จุดตรวจสอบล่าสุดที่สร้างขึ้นจากการฝึกอบรม เนื่องจากโฟลเดอร์อะแดปเตอร์มีไฟล์พารามิเตอร์จากการฝึกอบรมจึงไม่จำเป็นต้องระบุ --model หรือ --system แยกต่างหาก

 # Using an interactive command line for inference.
CUDA_VISIBLE_DEVICES=0 
swift infer 
    --adapters output/vx-xxx/checkpoint-xxx 
    --stream true 
    --temperature 0 
    --max_new_tokens 2048

# merge-lora and use vLLM for inference acceleration
CUDA_VISIBLE_DEVICES=0 
swift infer 
    --adapters output/vx-xxx/checkpoint-xxx 
    --stream true 
    --merge_lora true 
    --infer_backend vllm 
    --max_model_len 8192 
    --temperature 0 
    --max_new_tokens 2048

web-ui

Web-UI เป็นโซลูชันการฝึกอบรมและการปรับใช้ส่วนต่อประสานที่ ไม่มีผล ตามเทคโนโลยี สำหรับรายละเอียดเพิ่มเติมคุณสามารถตรวจสอบได้ที่นี่

SWIFT_UI_LANG=en swift web-ui

ใช้ Python

MS-Swift ยังสนับสนุนการฝึกอบรมและการอนุมานโดยใช้ Python ด้านล่างนี้เป็น pseudocode สำหรับการฝึกอบรมและการอนุมาน สำหรับรายละเอียดเพิ่มเติมคุณสามารถอ้างถึงที่นี่

การฝึกอบรม:

 # Retrieve the model and template, and add a trainable LoRA module
model , tokenizer = get_model_tokenizer ( model_id_or_path , ...)
template = get_template ( model . model_meta . template , tokenizer , ...)
model = Swift . prepare_model ( model , lora_config )

# Download and load the dataset, and encode the text into tokens
train_dataset , val_dataset = load_dataset ( dataset_id_or_path , ...)
train_dataset = EncodePreprocessor ( template = template )( train_dataset , num_proc = num_proc )
val_dataset = EncodePreprocessor ( template = template )( val_dataset , num_proc = num_proc )

# Train the model
trainer = Seq2SeqTrainer (
    model = model ,
    args = training_args ,
    data_collator = template . data_collator ,
    train_dataset = train_dataset ,
    eval_dataset = val_dataset ,
    template = template ,
)
trainer . train ()

การอนุมาน:

 # Perform inference using the native PyTorch engine
engine = PtEngine ( model_id_or_path , adapters = [ lora_checkpoint ])
infer_request = InferRequest ( messages = [{ 'role' : 'user' , 'content' : 'who are you?' }])
request_config = RequestConfig ( max_tokens = max_new_tokens , temperature = temperature )

resp_list = engine . infer ([ infer_request ], request_config )
print ( f'response: { resp_list [ 0 ]. choices [ 0 ]. message . content } ' )

การใช้งาน

นี่คือตัวอย่างที่ง่ายที่สุดของการฝึกอบรมเพื่อการปรับใช้โดยใช้ MS-Swift สำหรับรายละเอียดเพิ่มเติมคุณสามารถตรวจสอบตัวอย่าง

ลิงค์ที่มีประโยชน์
พารามิเตอร์บรรทัดคำสั่ง
รุ่นที่รองรับและชุดข้อมูล
โมเดลที่กำหนดเองชุดข้อมูลที่กำหนดเอง
การสอน LLM

การฝึกอบรม

การฝึกอบรมล่วงหน้า:

 # 8*A100
NPROC_PER_NODE=8 
CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 
swift pt 
    --model Qwen/Qwen2.5-7B 
    --dataset swift/chinese-c4 
    --streaming true 
    --train_type full 
    --deepspeed zero2 
    --output_dir output 
    --max_steps 100000 
    ...

ปรับแต่ง:

CUDA_VISIBLE_DEVICES=0 swift sft 
    --model Qwen/Qwen2.5-7B-Instruct 
    --dataset AI-ModelScope/alpaca-gpt4-data-en 
    --train_type lora 
    --output_dir output 
    ...

RLHF:

CUDA_VISIBLE_DEVICES=0 swift rlhf 
    --rlhf_type dpo 
    --model Qwen/Qwen2.5-7B-Instruct 
    --dataset hjh0119/shareAI-Llama3-DPO-zh-en-emoji:en 
    --train_type lora 
    --output_dir output 
    ...

การอนุมาน

CUDA_VISIBLE_DEVICES=0 swift infer 
    --model Qwen/Qwen2.5-7B-Instruct 
    --stream true 
    --infer_backend pt 
    --max_new_tokens 2048

# LoRA
CUDA_VISIBLE_DEVICES=0 swift infer 
    --model Qwen/Qwen2.5-7B-Instruct 
    --adapters swift/test_lora 
    --stream true 
    --infer_backend pt 
    --temperature 0 
    --max_new_tokens 2048

การปรับใช้

CUDA_VISIBLE_DEVICES=0 swift deploy 
    --model Qwen/Qwen2.5-7B-Instruct 
    --infer_backend vllm

การประเมิน

CUDA_VISIBLE_DEVICES=0 swift eval 
    --model Qwen/Qwen2.5-7B-Instruct 
    --infer_backend lmdeploy 
    --eval_dataset ARC_c

การวัดปริมาณ

CUDA_VISIBLE_DEVICES=0 swift export 
    --model Qwen/Qwen2.5-7B-Instruct 
    --quant_bits 4 --quant_method awq 
    --dataset AI-ModelScope/alpaca-gpt4-data-zh 
    --output_dir Qwen2.5-7B-Instruct-AWQ

- ใบอนุญาต

เฟรมเวิร์กนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต Apache (เวอร์ชัน 2.0) สำหรับรุ่นและชุดข้อมูลโปรดดูหน้าทรัพยากรดั้งเดิมและทำตามใบอนุญาตที่เกี่ยวข้อง

- การอ้างอิง

 @misc { zhao2024swiftascalablelightweightinfrastructure ,
      title = { SWIFT:A Scalable lightWeight Infrastructure for Fine-Tuning } ,
      author = { Yuze Zhao and Jintao Huang and Jinghan Hu and Xingjun Wang and Yunlin Mao and Daoze Zhang and Zeyinzi Jiang and Zhikai Wu and Baole Ai and Ang Wang and Wenmeng Zhou and Yingda Chen } ,
      year = { 2024 } ,
      eprint = { 2408.05517 } ,
      archivePrefix = { arXiv } ,
      primaryClass = { cs.CL } ,
      url = { https://arxiv.org/abs/2408.05517 } ,
}