الكود الرسمي للورقة "نمذجة اللغة المدركة للسياق لأنظمة الحوار الموجهة نحو الأهداف"
موقع المشروع | arxiv
conda create --name CALM python=3.9.7conda activate CALMpip install -r requirements.txtconda install pytorch==1.9.0 cudatoolkit=11.3 -c pytorch -c conda-forgeexport PYTHONPATH="$PWD/offline_airdialogue"outputs/ المجلد على نقاط تفتيش لنموذجنا الرئيسي ، ونموذجنا المسبق للمهمة ، وروبوت العملاء لدينا. (ملاحظة: تستخدم جميع عمليات التدريب WANDB افتراضيًا ، يمكنك إيقاف مزامنة WANDB في التكوين.)
cd scripts/train
لتشغيل تدريب متعدد GPU المتوازي للبيانات ، على أي من الأوامر أدناه ، استبدل python <script_path> بـ python -m torch.distributed.launch --nproc_per_node <n_GPUs> --use_env <script_path> .
هدوء ما قبل
(نوعان من دالة الخسارة الإضافية)
البرنامج النصي: python train_pretrain_table_agent.py
التكوين: config/train_pretrain_table_agent.yaml
البرنامج النصي: python train_pretrain_simplified_aux_gpt2.py
config: config/train_pretrain_simplified_aux_gpt2.yaml
تدريب روبوت العميل
python train_customer.pyconfig/train_customer_bot.yaml هدوء التدريب
(نوعان من دالة الخسارة الإضافية)
البرنامج النصي: python train_real_table_agent.py
التكوين: config/train_real_table_agent.yaml
البرنامج النصي: python train_simplified_aux_gpt2.py
config: config/train_simplified_aux_agent.yaml
التدريب المعيار LM
python train_basic_agent.pyconfig/train_basic_agent.yamlتدريب نموذج المكافآت للتخطيط المعتمد على النموذج
python train_constraint_parser.pyconfig/train_constraint_parser.yaml cd scripts/eval
تقييم محاكاة
python selfplay_eval.pyconfig/selfplay_eval.yamlselfplay/outputs_file في التكوين. لطباعة معدل نجاح تشغيل SelfPlay: python compute_results.py --results_file <your_eval_outputs_file>CUDA_VISIBLE_DEVICES=<comma_seperated_list_of_gpu_indicies>تقييم جودة اللغة
python language_quality_eval.pyconfig/language_eval.yamlpython -m torch.distributed.launch --nproc_per_node <n_GPUs> --use_env language_quality_eval.py