extreme bert Download - extreme bert Source Code Download

extreme bert

Anderer Quellcode

1.0.0

Herunterladen

Extremeber: Beschleunigen Sie Ihre LM-Vorausbildung!

Extremebert ist ein Toolkit, das die Vorbereitung und Fülle von Bert auf angepassten Datensätzen beschleunigt. Schauen Sie sich einen kurzen Blick auf unsere Dokumentation und unser Papier.

Merkmale

Einfache Installation

Wir vereinfachen den Installationsprozess von Abhängigkeiten, die vom Paket erforderlich sind. Sie können einfach durch eine einzelne source install.sh installiert werden. Es sind keine anderen Schritte erforderlich!

Schnelles Training

Die Zeit für die Vorabstärke kann auf einen zeitbasierten Wert reduziert werden, indem --total_training_time=24.0 (zum Beispiel 24 Stunden) definiert wird. Gemischte Präzision wird durch Hinzufügen --fp16 unterstützt.

Kleberleistung

Datensatzzoo

Unterstützen Sie eine große Anzahl von Datensätzen vor dem Training. Benutzer können sie problemlos über den Datensatz von Huggingface -Hub verwenden. Darüber hinaus unterstützen wir den benutzerdefinierten Datensatz von Benutzern.

Optimierungsfreundlich

Es ist schwierig, die Wirksamkeit einer neuen Optimierungsmethode bei LM vor der Ausbildung zu überprüfen. Mit unserem Paket unterstützen wir die Integration maßgeschneiderter Optimierer und Scheduler in die Pipeline, die Forschern in der Optimierungsgemeinschaft dabei helfen, ihre Algorithmen einfach zu überprüfen. Zukünftige Releases werden ebenfalls effiziente Optimierungs- und Datenverarbeitungsalgorithmen hinzugefügt.

Unterstützte Modelle

Modell	Status
Bert	✅ unterstützt
Roberta, Albert, Deberta	? Entwicklung

Systemanforderungen

Linux ubuntu> = 18.04.
Mindestens 20 GB GPU -Speicher, z.
Mindestens 200 GB Speicherplatz.

Konfigurierbare Pipeline

Zuerst kann man sich auf configs/bert-simple.yaml beziehen und geeignete Konfigurationen für die Pipeline erstellen, einschließlich Datensätze, Anzahl der verfügbaren GPUs usw. Dann wird die gesamte Pipeline durch einfaches Ausführen der gesamten Pipeline nach der Bühne ausgeführt.

 source install.sh ; python main.py --config configs/bert-simple.yaml

Die Umgebungsinstallation, Datensatzvorberufung, Vorab-, Finetuning- und Testergebnissammlung nacheinander und generieren Sie die Einreichung von .zip -Datei für den Klebetestserver unter output_test_translated/finetune/*/*.zip . Weitere Informationen zur YAML -Konfigurationsdatei finden Sie unter pipeline_config.md.

Die Einzelheiten der einzelnen Stufen sind in den folgenden Abschnitten dargestellt.

Installation

Führen Sie source install.sh

Datensatz

Das dataset -Verzeichnis enthält Skripte, um die in unseren Experimenten verwendeten Datensätze (Wikipedia, Bookcorpus) vorzubereiten. Weitere Informationen finden Sie unter Dedicated Readme.

Vorab

Vorab -Skript: run_pretraining.py

Für alle möglichen Argumente vorab siehe: python run_pretraining.py -h

Beispiel für das Training mit der besten Konfiguration, die in unserem Artikel vorgestellt wurde (24-Schichten/1024H/zeitbasierte Lernrate-Zeitplan/FP16):

deepspeed run_pretraining.py 
  --model_type bert-mlm --tokenizer_name bert-large-uncased 
  --hidden_act gelu 
  --hidden_size 1024 
  --num_hidden_layers 24 
  --num_attention_heads 16 
  --intermediate_size 4096 
  --hidden_dropout_prob 0.1 
  --attention_probs_dropout_prob 0.1 
  --encoder_ln_mode pre-ln 
  --lr 1e-3 
  --train_batch_size 4096 
  --train_micro_batch_size_per_gpu 32 
  --lr_schedule time 
  --curve linear 
  --warmup_proportion 0.06 
  --gradient_clipping 0.0 
  --optimizer_type adamw 
  --weight_decay 0.01 
  --adam_beta1 0.9 
  --adam_beta2 0.98 
  --adam_eps 1e-6 
  --total_training_time 24.0 
  --early_exit_time_marker 24.0 
  --dataset_path < dataset path > 
  --output_dir /tmp/training-out 
  --print_steps 100 
  --num_epochs_between_checkpoints 10000 
  --job_name pretraining_experiment 
  --project_name budget-bert-pretraining 
  --validation_epochs 3 
  --validation_epochs_begin 1 
  --validation_epochs_end 1 
  --validation_begin_proportion 0.05 
  --validation_end_proportion 0.01 
  --validation_micro_batch 16 
  --deepspeed 
  --data_loader_type dist 
  --do_validation 
  --use_early_stopping 
  --early_stop_time 180 
  --early_stop_eval_loss 6 
  --seed 42 
  --fp16

Feinabstimmung

Verwenden Sie run_glue.py , um die Finetuning für einen gespeicherten Kontrollpunkt für Kleberaufgaben auszuführen.

Das Finetuning -Skript ist identisch mit dem, das durch Umarmung mit dem Hinzufügen unseres Modells bereitgestellt wird.

Für alle möglichen Argumente vorab siehe: python run_glue.py -h

Beispiel für die Finetuning bei MRPC:

python run_glue.py 
  --model_name_or_path < path to model > 
  --task_name MRPC 
  --max_seq_length 128 
  --output_dir /tmp/finetuning 
  --overwrite_output_dir 
  --do_train --do_eval 
  --evaluation_strategy steps 
  --per_device_train_batch_size 32 --gradient_accumulation_steps 1 
  --per_device_eval_batch_size 32 
  --learning_rate 5e-5 
  --weight_decay 0.01 
  --eval_steps 50 --evaluation_strategy steps 
  --max_grad_norm 1.0 
  --num_train_epochs 5 
  --lr_scheduler_type polynomial 
  --warmup_steps 50

Zitat

Wenn Sie dieses Repository nützlich finden, können Sie unser Papier als:

 @inproceedings{extreme-bert,
    title={ExtremeBERT: A Toolkit for Accelerating Pretraining of Customized BERT}, 
    author={Rui Pan and Shizhe Diao and Jianlin Chen and Tong Zhang},
    year={2022},
    eprint={2211.17201},
    archivePrefix={arXiv},
    primaryClass={cs.CL},
    url={https://arxiv.org/abs/2211.17201},
}

Anerkennung

Ein wesentlicher Teil des Codes basiert auf der Ausbildung von Bert mit einem unter Apache 2.0 lizenzierten akademischen Budget.

Kontakt

Für Hilfe oder Probleme mit diesem Paket senden Sie bitte ein GitHub -Problem.

Für persönliche Mitteilung zu diesem Paket wenden Sie sich bitte an Rui Pan ([email protected]) und Shizhe Diao ([email protected]).

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-04-16
Größe 2.72MB
Kommt von Github

Ähnliche Anwendungen

Blocky Extreme-Spiele

2023-08-23
Extreme Autoinstallation

2023-03-15
Pilzzerkleinerer Extreme

2022-09-01
Gasfresser Extrem

2022-08-19
eXtreme-Dateihosting

2009-05-21
falt4 extreme RC4

2009-04-20

extreme bert

Extremeber: Beschleunigen Sie Ihre LM-Vorausbildung!

Merkmale

Einfache Installation

Schnelles Training

Datensatzzoo

Optimierungsfreundlich

Unterstützte Modelle

Systemanforderungen

Konfigurierbare Pipeline

Installation

Datensatz

Vorab

Beispiel für das Training mit der besten Konfiguration, die in unserem Artikel vorgestellt wurde (24-Schichten/1024H/zeitbasierte Lernrate-Zeitplan/FP16):

Feinabstimmung

Beispiel für die Finetuning bei MRPC:

Zitat

Anerkennung

Kontakt

Blocky Extreme-Spiele

Extreme Autoinstallation

Pilzzerkleinerer Extreme

Gasfresser Extrem

eXtreme-Dateihosting

falt4 extreme RC4

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express