Kode resmi untuk makalah "Pemodelan Bahasa Sadar Konteks untuk Sistem Dialog Berorientasi Sasaran"
Situs Proyek | arxiv
conda create --name CALM python=3.9.7conda activate CALMpip install -r requirements.txtconda install pytorch==1.9.0 cudatoolkit=11.3 -c pytorch -c conda-forgeexport PYTHONPATH="$PWD/offline_airdialogue"outputs/ folder berisi pos pemeriksaan untuk model utama kami, model pretrained tugas kami, dan bot pelanggan kami. (Catatan: Semua pelatihan berjalan menggunakan wandb secara default, Anda dapat mematikan sinkronisasi wandb di konfigurasi.)
cd scripts/train
Untuk menjalankan pelatihan multi-GPU data-paralel, pada salah satu perintah di bawah ini menggantikan python <script_path> dengan python -m torch.distributed.launch --nproc_per_node <n_GPUs> --use_env <script_path> .
Pretraining tenang
(Dua varian fungsi kerugian tambahan)
Script: python train_pretrain_table_agent.py
Config: config/train_pretrain_table_agent.yaml
Script: python train_pretrain_simplified_aux_gpt2.py
Config: config/train_pretrain_simplified_aux_gpt2.yaml
Melatih bot pelanggan
python train_customer.pyconfig/train_customer_bot.yaml Pelatihan Tenang
(Dua varian fungsi kerugian tambahan)
Script: python train_real_table_agent.py
Config: config/train_real_table_agent.yaml
Script: python train_simplified_aux_gpt2.py
Config: config/train_simplified_aux_agent.yaml
Pelatihan Standar LM
python train_basic_agent.pyconfig/train_basic_agent.yamlMelatih model hadiah untuk perencanaan peluncuran berbasis model
python train_constraint_parser.pyconfig/train_constraint_parser.yaml cd scripts/eval
Evaluasi simulasi
python selfplay_eval.pyconfig/selfplay_eval.yamlselfplay/outputs_file di konfigurasi. Untuk mencetak tingkat keberhasilan untuk menjalankan mandiri: python compute_results.py --results_file <your_eval_outputs_file>CUDA_VISIBLE_DEVICES=<comma_seperated_list_of_gpu_indicies>Evaluasi Kualitas Bahasa
python language_quality_eval.pyconfig/language_eval.yamlpython -m torch.distributed.launch --nproc_per_node <n_GPUs> --use_env language_quality_eval.py