ดาวน์โหลด extreme bert - extreme bert Source Source Download

extreme bert

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

Extremebert: เร่งการฝึกอบรมล่วงหน้า LM ของคุณ!

Extremebert เป็นชุดเครื่องมือที่เร่งการเตรียมการและ finetuning ของ Bert ในชุดข้อมูลที่กำหนดเอง ดูเอกสารและกระดาษของเราอย่างรวดเร็ว

คุณสมบัติ

การติดตั้งง่ายๆ

เราทำให้กระบวนการติดตั้งง่ายขึ้นของการพึ่งพาที่ต้องการโดยแพ็คเกจ สามารถติดตั้งได้อย่างง่ายดายโดย source install.sh คำสั่งเดียว ไม่จำเป็นต้องมีขั้นตอนอื่น!

การฝึกอบรมอย่างรวดเร็ว

เวลาการเตรียมการสามารถลดลงเป็นค่าตามเวลาโดยการกำหนด --total_training_time=24.0 (ตัวอย่าง 24 ชั่วโมง) ความแม่นยำแบบผสมได้รับการสนับสนุนโดยการเพิ่ม --fp16

กาว

สวนสาธารณะชุดข้อมูล

รองรับชุดข้อมูลก่อนการฝึกอบรมจำนวนมาก ผู้ใช้สามารถใช้งานได้อย่างง่ายดายผ่านศูนย์ข้อมูล HuggingFace นอกจากนี้เรายังสนับสนุนชุดข้อมูลที่กำหนดเองของผู้ใช้

เป็นมิตรกับการเพิ่มประสิทธิภาพ

เป็นการยากที่จะตรวจสอบประสิทธิภาพของวิธีการเพิ่มประสิทธิภาพใหม่ในการฝึกอบรมล่วงหน้า LM ด้วยแพ็คเกจของเราเราสนับสนุนการรวมตัวของตัวเพิ่มประสิทธิภาพและกำหนดเวลาที่กำหนดเองเข้ากับไปป์ไลน์ซึ่งช่วยให้นักวิจัยในชุมชนการปรับให้เหมาะสมสามารถตรวจสอบอัลกอริทึมของพวกเขาได้อย่างง่ายดาย การเพิ่มประสิทธิภาพที่มีประสิทธิภาพและอัลกอริธึมการประมวลผลข้อมูลจะถูกเพิ่มเข้าไปในการเปิดตัวในอนาคต

รุ่นที่รองรับ

แบบอย่าง	สถานะ
เบิร์ต	✅สนับสนุน
Roberta, Albert, Deberta	- การพัฒนา

ข้อกำหนดของระบบ

Linux Ubuntu> = 18.04
หน่วยความจำ GPU อย่างน้อย 20 GB เช่น GPU 3090 X1 หรือ 2080TI GPU X2, GeForce RTX 3070 x4 ฯลฯ
พื้นที่ดิสก์อย่างน้อย 200GB

ไปป์ไลน์ที่กำหนดค่าได้

ขั้นแรกหนึ่งอาจอ้างถึง configs/bert-simple.yaml และกำหนดค่าที่เหมาะสมสำหรับไปป์ไลน์รวมถึงชุดข้อมูลจำนวน GPU ที่มีอยู่ ฯลฯ จากนั้นเพียงแค่เรียกใช้คำสั่งต่อไปนี้ไปป์ไลน์ทั้งหมดจะดำเนินการตามขั้นตอน

 source install.sh ; python main.py --config configs/bert-simple.yaml

ซึ่งจะเรียกใช้การติดตั้งสภาพแวดล้อมการเตรียมชุดข้อมูลการเตรียม pretraining, finetuning และการทดสอบผลการทดสอบหนึ่งทีละหนึ่งและสร้างไฟล์. zip สำหรับการส่งเซิร์ฟเวอร์ทดสอบกาวภายใต้ output_test_translated/finetune/*/*.zip โปรดดูที่ pipeline_config.md สำหรับข้อมูลเพิ่มเติมเกี่ยวกับไฟล์กำหนดค่า YAML

รายละเอียดของแต่ละขั้นตอนจะแสดงในส่วนต่อไปนี้

การติดตั้ง

เรียกใช้ source install.sh

ชุดข้อมูล

ไดเรกทอรี dataset รวมถึงสคริปต์เพื่อประมวลผลชุดข้อมูลที่เราใช้ในการทดลองของเรา (Wikipedia, Bookcorpus) ดู ReadMe เฉพาะสำหรับรายละเอียดทั้งหมด

การผ่าตัดก่อน

สคริปต์การเตรียมการ: run_pretraining.py

สำหรับอาร์กิวเมนต์ pretraining ที่เป็นไปได้ทั้งหมดดู: python run_pretraining.py -h

ตัวอย่างสำหรับการฝึกอบรมด้วยการกำหนดค่าที่ดีที่สุดที่นำเสนอในบทความของเรา (24-LAYERS/1024H/ตารางอัตราการเรียนรู้ตามเวลา/FP16):

deepspeed run_pretraining.py 
  --model_type bert-mlm --tokenizer_name bert-large-uncased 
  --hidden_act gelu 
  --hidden_size 1024 
  --num_hidden_layers 24 
  --num_attention_heads 16 
  --intermediate_size 4096 
  --hidden_dropout_prob 0.1 
  --attention_probs_dropout_prob 0.1 
  --encoder_ln_mode pre-ln 
  --lr 1e-3 
  --train_batch_size 4096 
  --train_micro_batch_size_per_gpu 32 
  --lr_schedule time 
  --curve linear 
  --warmup_proportion 0.06 
  --gradient_clipping 0.0 
  --optimizer_type adamw 
  --weight_decay 0.01 
  --adam_beta1 0.9 
  --adam_beta2 0.98 
  --adam_eps 1e-6 
  --total_training_time 24.0 
  --early_exit_time_marker 24.0 
  --dataset_path < dataset path > 
  --output_dir /tmp/training-out 
  --print_steps 100 
  --num_epochs_between_checkpoints 10000 
  --job_name pretraining_experiment 
  --project_name budget-bert-pretraining 
  --validation_epochs 3 
  --validation_epochs_begin 1 
  --validation_epochs_end 1 
  --validation_begin_proportion 0.05 
  --validation_end_proportion 0.01 
  --validation_micro_batch 16 
  --deepspeed 
  --data_loader_type dist 
  --do_validation 
  --use_early_stopping 
  --early_stop_time 180 
  --early_stop_eval_loss 6 
  --seed 42 
  --fp16

การทำให้หมดแรง

ใช้ run_glue.py เพื่อเรียกใช้ finetuning สำหรับจุดตรวจที่บันทึกไว้ในงานกาว

สคริปต์ Finetuning นั้นเหมือนกับที่ได้รับจาก HuggingFace ด้วยการเพิ่มโมเดลของเรา

สำหรับอาร์กิวเมนต์การเตรียมการที่เป็นไปได้ทั้งหมดดู: python run_glue.py -h

ตัวอย่างสำหรับ finetuning บน MRPC:

python run_glue.py 
  --model_name_or_path < path to model > 
  --task_name MRPC 
  --max_seq_length 128 
  --output_dir /tmp/finetuning 
  --overwrite_output_dir 
  --do_train --do_eval 
  --evaluation_strategy steps 
  --per_device_train_batch_size 32 --gradient_accumulation_steps 1 
  --per_device_eval_batch_size 32 
  --learning_rate 5e-5 
  --weight_decay 0.01 
  --eval_steps 50 --evaluation_strategy steps 
  --max_grad_norm 1.0 
  --num_train_epochs 5 
  --lr_scheduler_type polynomial 
  --warmup_steps 50

การอ้างอิง

หากคุณพบว่าพื้นที่เก็บข้อมูลนี้มีประโยชน์คุณอาจอ้างถึงกระดาษของเราเป็น:

 @inproceedings{extreme-bert,
    title={ExtremeBERT: A Toolkit for Accelerating Pretraining of Customized BERT}, 
    author={Rui Pan and Shizhe Diao and Jianlin Chen and Tong Zhang},
    year={2022},
    eprint={2211.17201},
    archivePrefix={arXiv},
    primaryClass={cs.CL},
    url={https://arxiv.org/abs/2211.17201},
}

กิตติกรรมประกาศ

ส่วนสำคัญของรหัสขึ้นอยู่กับวิธีการฝึกอบรม Bert ด้วยงบประมาณเชิงวิชาการที่ได้รับอนุญาตภายใต้ Apache 2.0

ติดต่อ

สำหรับความช่วยเหลือหรือปัญหาที่ใช้แพ็คเกจนี้โปรดส่งปัญหา GitHub

สำหรับการสื่อสารส่วนบุคคลที่เกี่ยวข้องกับแพ็คเกจนี้โปรดติดต่อ Rui Pan ([email protected]) และ Shizhe Diao ([email protected])

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-04-16
ขนาด 2.72MB
มาจาก Github

แอปที่เกี่ยวข้อง

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด

extreme bert

Extremebert: เร่งการฝึกอบรมล่วงหน้า LM ของคุณ!

คุณสมบัติ

การติดตั้งง่ายๆ

การฝึกอบรมอย่างรวดเร็ว

สวนสาธารณะชุดข้อมูล

เป็นมิตรกับการเพิ่มประสิทธิภาพ

รุ่นที่รองรับ

ข้อกำหนดของระบบ

ไปป์ไลน์ที่กำหนดค่าได้

การติดตั้ง

ชุดข้อมูล

การผ่าตัดก่อน

การทำให้หมดแรง

ตัวอย่างสำหรับ finetuning บน MRPC:

การอ้างอิง

กิตติกรรมประกาศ

ติดต่อ

เกมส์บล็อคกี้เอ็กซ์ตรีม

การติดตั้งรถเอ็กซ์ตรีม

เครื่องบดเห็ดสุดขีด

แก๊สตะกละตะกลามมาก

โฮสติ้งไฟล์ eXtreme

falt4 สุดขีด RC4

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express