Noisy Exemplars Make Large Language Models More Robust - Noisy Exemplars Make Large Language Models More Robust

Noisy Exemplars Make Large Language Models More Robust

Código-Fonte de IA

1.0.0

Baixar

Os exemplos barulhentos tornam grandes modelos de linguagem mais robustos: uma análise comportamental agnóstica de domínio

Execute testes

python evaluate.py --model <model_name> --dataset <dataset_name> --prompt <prompt method name> --shot <# shots> --perturb <perturbation type name> --perturb_exemplar <True/False> --dev/--no-dev

model : gptturbo (recomendado) ou gpt3
dataset : atualmente, apenas gsm8k é suportado
prompt : cot , 0cot ou ltm
shot : 1 , 2 , 4 ou 8
perturb : synonym , repetition , shortcut , typo ou None
perturb_exemplar : True ou False , indicando se deve aplicar a perturbação em perguntas exemplares
dev : True ou False , indicando se deve usar o mini conjunto de dados de 5 exemplos para depuração ou não

Antes de executar o código, crie um arquivo .env no diretório raiz e adicione a seguinte linha:

OPENAI_API_KEY=<your openai api key>

Após a conclusão do programa, o nome do arquivo de log do teste junto com os hyperparameters será gravado em log_files.csv

Avaliação de desempenho

python compute_accuracy.py

Após a conclusão, o programa deve criar um novo arquivo chamado log_files_with_accuracy.csv , que adiciona coluna accuracy ao log_files.csv original