Download AgentReview - download do código fonte AgentReview

AgentReview

Outro código-fonte

1.0.0

Baixar

título	Emoji	colorfrom	Colorto	sdk	sdk_version	APP_FILE	preso	licença	short_description
AgentReview	?	índigo	rosa	Gradio	5.4.0	app.py	falso	Apache-2.0	EMNLP 2024

AgentReview

Implementação oficial para o artigo principal da faixa principal do EMNLP 2024 (ORAL) - AgentReview: Explorando a dinâmica de revisão por pares com agentes LLM

Demoção ｜ Site | ? Papel | ? Arxiv ｜ Código

 @inproceedings { jin2024agentreview ,
  title = { AgentReview: Exploring Peer Review Dynamics with LLM Agents } ,
  author = { Jin, Yiqiao and Zhao, Qinlin and Wang, Yiyang and Chen, Hao and Zhu, Kaijie and Xiao, Yijia and Wang, Jindong } ,
  booktitle = { EMNLP } ,
  year = { 2024 }
}

Introdução

O AgentReview é uma estrutura baseada em Modelo de Linguagem Grande (LLM) pioneira para simular processos de revisão por pares, desenvolvidos para analisar e abordar os fatores complexos e multivariados que influenciam os resultados da revisão. Diferentemente dos métodos estatísticos tradicionais, o AgentReview captura variáveis latentes, respeitando a privacidade dos dados sensíveis de revisão por pares.

Resumo acadêmico

A revisão por pares é fundamental para a integridade e o avanço da publicação científica. Os métodos tradicionais das análises de revisão por pares geralmente dependem da exploração e das estatísticas dos dados existentes de revisão por pares, que não abordam adequadamente a natureza multivariada do processo, são responsáveis pelas variáveis latentes e são restringidas por preocupações de privacidade devido à natureza sensível dos dados. Introduzimos o AgentReview, a primeira estrutura de simulação de revisão por pares baseada em Modelo de Idioma (LLM), que efetivamente desafia os impactos de múltiplos fatores latentes e aborda a questão da privacidade. Nosso estudo revela idéias significativas, incluindo uma variação notável de 37,1% nas decisões do papel devido aos vieses dos revisores, apoiados por teorias sociológicas, como teoria da influência social, fadiga de altruísmo e viés de autoridade. Acreditamos que este estudo poderia oferecer informações valiosas para melhorar o design dos mecanismos de revisão por pares.

Revise o design do estágio

Começando

Instalação

Baixar os dados

Faça o download dos dois arquivos ZIP neste Dropbox:

UNZIP Agentreview_paper_data.zip em data/ , que contém:

As versões em PDF do papel
A revisão por pares do mundo real para ICLR 2020 - 2023

unzip AgentReview_Paper_Data.zip -d data/

(Opcional) UNZIP Agentreview_llm_reviews.zip em outputs/ , que contém as revisões geradas por LLM, (nosso conjunto de dados gerado por LLM)

unzip AgentReview_LLM_Review.zip -d outputs/

Instale os pacotes necessários :

 cd AgentReview/
pip install -r requirements.txt

Defina variáveis de ambiente

Se você usar a API OpenAI, defina o OpenAI_API_KEY.

 export OPENAI_API_KEY=... # Format: sk-...

Se você usar a API do AzureOpenai, defina o seguinte

 export AZURE_ENDPOINT=...  # Format: https://<your-endpoint>.openai.azure.com/
export AZURE_DEPLOYMENT=...  # Your Azure OpenAI deployment here
export AZURE_OPENAI_KEY=... # Your Azure OpenAI key here

Executando o projeto

Defina as variáveis do ambiente em run.sh e execute -o:

bash run.sh

Nota: Todos os arquivos do projeto devem ser executados no diretório AgentReview .

Demonstração

Uma demonstração pode ser encontrada em notebooks/demo.ipynb

Personalizando seu próprio ambiente

Você pode adicionar uma nova configuração no agentreview/experiment_config.py e adicionar a configuração como uma nova entrada ao Dictionary all_settings :

 all_settings = {
    "BASELINE" : baseline_setting ,
    "benign_Rx1" : benign_Rx1_setting ,
    ...
    " your_setting_name ": your_setting

Visão geral da estrutura

Design de estágio

Nossa simulação adota um pipeline estruturado de 5 fases

Fase I. Avaliação do revisor. Cada manuscrito é avaliado por três revisores de forma independente.
Fase II. Discussão de revisão do autor. Os autores enviam refutações para abordar as preocupações dos revisores;
Fase III. Discussão do revisor-AC. O CA facilita as discussões entre os revisores, provocando atualizações para suas avaliações iniciais.
Fase IV. Compilação de meta-revisão. O CA sintetiza as discussões em uma meta-revisão.
Fase V. Decisão de papel. O AC toma a decisão final sobre aceitar ou rejeitar o artigo, com base em todas as entradas reunidas.

Observação

Utilizamos uma taxa de aceitação fixa de 32%, correspondendo à taxa de aceitação real do ICLR 2020 - 2023. Consulte as taxas de aceitação da conferência para obter mais informações.
Às vezes, a API pode aplicar filtragem estrita à solicitação. Pode ser necessário ajustar a filtragem de conteúdo para obter os resultados desejados.