
Enquanto os grandes modelos de idiomas (LLMs) demonstram recursos impressionantes, eles ainda lutam para gerar conteúdo factualmente incorreto (ou seja, alucinações). Uma abordagem promissora para mitigar esse problema está permitindo que os modelos expressem incerteza quando não tiveram certeza. Pesquisas anteriores sobre modelagem de incerteza se concentraram principalmente no controle de qualidade de formato curto, mas as aplicações do mundo real geralmente exigem respostas muito mais longas. Neste trabalho, apresentamos a tarefa de geração de forma longa com incerteza (LOGU). Identificamos dois desafios -chave: supressão da incerteza , onde os modelos hesitam em expressar incerteza e desalinhamento da incerteza , onde os modelos transmitem incerteza imprecisamente.
Para enfrentar esses desafios, propomos uma estrutura de coleta de dados baseada em refinamento e um pipeline de treinamento em duas etapas. Nossa estrutura adota uma estratégia de divisão e conquista, refinando a incerteza com base em reivindicações atômicas. Os dados coletados são então usados no treinamento por meio de ajuste fino supervisionado (SFT) e otimização direta de preferência (DPO) para melhorar a expressão da incerteza. Experimentos extensos em três instruções de formato longo após os conjuntos de dados mostram que nosso método melhora significativamente a precisão, reduz as alucinações e mantém a abrangência das respostas.

Você pode usar os seguintes comandos para instalar o ambiente para LOGU:
conda create -n LoGU python==3.8
conda activate LoGU
pip install -r lf_requirements.txt
pip install -r vllm_requirements.txtExperimente o seguinte comando para testar nosso método no BIOS, Longfact, Wildhallu:
cd ./scripts
bash generate_vllm_responses.shbash eval_pipeline.shbash generate_unc_answers.sh
bash factcheck_unc_answers.shEm breve!
Também fornecemos alguns modelos de expressão de incerteza no hub de modelos Huggingface para trilha rápida:
| Modelo | Link |
|---|---|
| rhyang2021/incerteza_llama3_8b | Huggingface |
| rhyang2021/incerteza_mistral_7b | Huggingface |
Se você tiver alguma dúvida, sinta -se à vontade para me enviar um e -mail ou me enviar um problema.