CALM Dialogue Download - CALM Dialogue Quellcode Download

Herunterladen

Kontextbewusste Sprachmodellierung für zielorientierte Dialogsysteme

Offizieller Code für das Papier "Kontextbewusste Sprachmodellierung für zielorientierte Dialogsysteme"

Projektseite | Arxiv

Create Conda Environment: conda create --name CALM python=3.9.7
Aktivieren Sie die Conda -Umgebung: conda activate CALM
Installation von Anforderungen: pip install -r requirements.txt
Installieren Sie Pytorch 1.9.0: conda install pytorch==1.9.0 cudatoolkit=11.3 -c pytorch -c conda-forge
export PYTHONPATH="$PWD/offline_airdialogue"
Laden Sie hier die verarbeiteten Daten und Modellkontrollpunkte herunter. Die outputs/ Ordner enthält Checkpoints für unser Hauptmodell, unser Task -Presained -Modell und unseren Kundenbot.

(Hinweis: Alle Trainingsläufe verwenden standardmäßig Wandb. Sie können die WANDB -Synchronisierung in der Konfiguration deaktivieren.)

cd scripts/train
Um das datenparallele Multi-GPU-Training auszuführen, ersetzen Sie bei allen folgenden Befehlen python <script_path> durch python -m torch.distributed.launch --nproc_per_node <n_GPUs> --use_env <script_path> .
Vorbereitung
(Zwei Varianten der Hilfsverlustfunktion)
- Skript: python train_pretrain_table_agent.py
  Konfiguration: config/train_pretrain_table_agent.yaml
- Skript: python train_pretrain_simplified_aux_gpt2.py
  Konfiguration: config/train_pretrain_simplified_aux_gpt2.yaml
Schulung des Kundenbots
- Skript: python train_customer.py
  config: config/train_customer_bot.yaml
Training ruhig
(Zwei Varianten der Hilfsverlustfunktion)
- Skript: python train_real_table_agent.py
  config: config/train_real_table_agent.yaml
- Skript: python train_simplified_aux_gpt2.py
  config: config/train_simplified_aux_agent.yaml
Trainingsstandard LM
- Skript: python train_basic_agent.py
  Konfiguration: config/train_basic_agent.yaml
Training des Belohnungsmodells für modellbasierte Rollout -Planung
- Skript: python train_constraint_parser.py
  Konfiguration: config/train_constraint_parser.yaml

cd scripts/eval
Simulierte Bewertung
- Skript: python selfplay_eval.py
  Konfiguration: config/selfplay_eval.yaml
  - Ein Protokoll der Ergebnisse wird in der von selfplay/outputs_file in der Konfiguration angegebenen Stelle gespeichert. So drucken Sie die Erfolgsrate für den Selfplay -Lauf aus: python compute_results.py --results_file <your_eval_outputs_file>
  - HINWEIS: Selfplay -Bewertung verwendet standardmäßig alle auf Ihrem Computer verfügbaren GPUs. Um anzugeben, welche GPUs verwendet werden sollen, präfixen Sie den Befehl mit CUDA_VISIBLE_DEVICES=<comma_seperated_list_of_gpu_indicies>
Sprachqualitätsbewertung
- Skript: python language_quality_eval.py
  Konfiguration: config/language_eval.yaml
  - Um die Bewertung auf mehreren GPUs zu parallelisieren, rennen Sie: python -m torch.distributed.launch --nproc_per_node <n_GPUs> --use_env language_quality_eval.py