Noisy Exemplars Make Large Language Models More Robust
1.0.0
python evaluate.py --model <model_name> --dataset <dataset_name> --prompt <prompt method name> --shot <# shots> --perturb <perturbation type name> --perturb_exemplar <True/False> --dev/--no-dev
model : gptturbo (推荐)或gpt3dataset :目前,仅支持gsm8kprompt : cot , 0cot或ltmshot 2 1 8 4perturb : synonym , repetition , shortcut , typo或Noneperturb_exemplar : True或False ,指示是否在示例性问题上应用扰动dev : True或False ,指示是否使用5个示例迷你数据集进行调试在运行代码之前,请确保在根目录中创建.env文件,并添加以下行:
OPENAI_API_KEY=<your openai api key>
程序完成运行后,将在log_files.csv中记录试验的日志文件名以及超参数
python compute_accuracy.py
完成后,程序应创建一个名为log_files_with_accuracy.csv的新文件,该文件将accuracy列添加到原始log_files.csv
python generate_plots.py
图是在/images目录下生成的
python clean_logs.py
这将从logs目录中删除所有未在log_files.csv中的日志文件