AgentReview Download - AgentReview Source Code Download

AgentReview

Anderer Quellcode

1.0.0

Herunterladen

Titel	Emoji	farblich	Colorto	SDK	sdk_version	app_file	festgesteckt	Lizenz	Short_description
AgentReview	?	Indigo	Rosa	Gradio	5.4.0	app.py	FALSCH	Apache-2.0	EMNLP 2024

AgentReview

Offizielle Implementierung für das AMNLP 2024 Hauptspur (Mündliche) Papier - AgentReview: Erforschung der Peer Review -Dynamik mit LLM -Agenten

Demo ｜ Website | ? Papier | Arxiv ｜ Code

 @inproceedings { jin2024agentreview ,
  title = { AgentReview: Exploring Peer Review Dynamics with LLM Agents } ,
  author = { Jin, Yiqiao and Zhao, Qinlin and Wang, Yiyang and Chen, Hao and Zhu, Kaijie and Xiao, Yijia and Wang, Jindong } ,
  booktitle = { EMNLP } ,
  year = { 2024 }
}

Einführung

AgentReview ist ein Pionier-Rahmen für das Basis von LLM-Basis (LLM) für die Simulation von Peer-Review-Prozessen (entwickelt, um die komplexen, multivariaten Faktoren zur Beeinflussung der Überprüfungsergebnisse zu analysieren und anzugehen. Im Gegensatz zu herkömmlichen statistischen Methoden erfasst AgentReview latente Variablen und respektiert die Privatsphäre sensibler Peer -Review -Daten.

Akademische Zusammenfassung

Peer Review ist grundlegend für die Integrität und Fortschritt der wissenschaftlichen Veröffentlichung. Traditionelle Methoden der Peer Review -Analysen beruhen häufig auf Exploration und Statistiken bestehender Peer -Review -Daten, die die multivariate Natur des Prozesses nicht angemessen behandeln, die latenten Variablen berücksichtigen und aufgrund der sensiblen Natur der Daten durch Datenschutzbedenken weiter eingeschränkt werden. Wir stellen AgentReview vor, das erste großartigen Rahmen des Peer Review -Simulations -Frameworks (LLM), das die Auswirkungen mehrerer latenter Faktoren effektiv entwirrt und das Problem der Privatsphäre befasst. Unsere Studie zeigt signifikante Erkenntnisse, einschließlich einer bemerkenswerten Variation von 37,1% der Papierentscheidungen aufgrund von Überprüfungsvorurteilen, die durch soziologische Theorien wie die Theorie des sozialen Einflusses, Altruismus -Müdigkeit und Autoritätsverzerrung unterstützt werden. Wir glauben, dass diese Studie wertvolle Erkenntnisse zur Verbesserung des Designs von Peer Review -Mechanismen bieten könnte.

Bewertungsstadiumdesign

Erste Schritte

Installation

Laden Sie die Daten herunter

Laden Sie beide Zip -Dateien in dieser Dropbox herunter:

Unzip agentReview_paper_data.zip unter data/ , das enthält:

Die PDF -Versionen des Papiers
Die reale Peer -Review für ICLR 2020 - 2023

unzip AgentReview_Paper_Data.zip -d data/

(Optional) Unzip AgentReview_LLM_Reviews.zip unter outputs/ , die die von LLM erstellten Bewertungen enthält (unser LLM-generierter Datensatz)

unzip AgentReview_LLM_Review.zip -d outputs/

Installieren Sie die erforderlichen Pakete :

 cd AgentReview/
pip install -r requirements.txt

Umgebungsvariablen festlegen

Wenn Sie OpenAI -API verwenden, setzen Sie OpenAI_API_KEY.

 export OPENAI_API_KEY=... # Format: sk-...

Wenn Sie die Azureopenai -API verwenden, stellen Sie Folgendes fest

 export AZURE_ENDPOINT=...  # Format: https://<your-endpoint>.openai.azure.com/
export AZURE_DEPLOYMENT=...  # Your Azure OpenAI deployment here
export AZURE_OPENAI_KEY=... # Your Azure OpenAI key here

Das Projekt ausführen

Legen Sie die Umgebungsvariablen in run.sh ein und rennen Sie sie:

bash run.sh

Hinweis: Alle Projektdateien sollten aus dem AgentReview -Verzeichnis ausgeführt werden.

Demo

Eine Demo finden Sie in notebooks/demo.ipynb

Anpassen Ihrer eigenen Umgebung

Sie können eine neue Einstellung in agentreview/experiment_config.py hinzufügen und dann die Einstellung als neue Eintrag zum all_settings -Wörterbuch hinzufügen:

 all_settings = {
    "BASELINE" : baseline_setting ,
    "benign_Rx1" : benign_Rx1_setting ,
    ...
    " your_setting_name ": your_setting

Rahmenübersicht

Bühnendesign

Unsere Simulation nimmt eine strukturierte 5-Phasen-Pipeline an

Phase I. Bewertung der Prüfer. Jedes Manuskript wird von drei Gutachtern unabhängig bewertet.
Phase II. Diskussion für Autor-Reviewer. Die Autoren senden Widerlegungen, um die Bedenken der Gutachter auszuräumen.
Phase III. Rezensent-AC-Diskussion. Die AC erleichtert die Diskussionen zwischen den Rezensenten und veranlasst Aktualisierungen ihrer ersten Bewertungen.
Phase IV. META-Überprüfungszusammenstellung. Der AC synthetisiert die Diskussionen in eine Meta-Überprüfung.
Phase V. Papierentscheidung. Die AC trifft die endgültige Entscheidung darüber, ob das Papier auf der Grundlage aller gesammelten Eingaben akzeptiert oder ablehnt.

Notiz

Wir verwenden eine feste Akzeptanzrate von 32%, was der tatsächlichen Akzeptanzrate von ICLR 2020 - 2023 entspricht. Weitere Informationen finden Sie in den Akzeptanzraten der Konferenz.
Manchmal kann die API strikte Filterung auf die Anfrage anwenden. Möglicherweise müssen Sie die Inhaltsfilterung einstellen, um die gewünschten Ergebnisse zu erhalten.

Lizenz

Dieses Projekt ist unter der Lizenz Apache-2.0 lizenziert.

Anerkennung

Die Implementierung basiert teilweise auf dem Chatarena -Framework.

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-02-27
Größe 2.35MB
Kommt von Github

Ähnliche Anwendungen

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

AgentReview

AgentReview

Einführung

Akademische Zusammenfassung

Erste Schritte

Installation

Anpassen Ihrer eigenen Umgebung

Rahmenübersicht

Bühnendesign

Notiz

Lizenz

Anerkennung

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf