AgentReviewダウンロード - AgentReviewソースコードのダウンロード

AgentReview

その他のソースコード

1.0.0

ダウンロード

タイトル	絵文字	色から	コロルト	SDK	sdk_version	app_file	ピン留め	ライセンス	short_description
agentReview	？	インジゴ	ピンク	グラデーション	5.4.0	app.py	間違い	Apache-2.0	EMNLP 2024

agentReview

？EMNLP 2024メイントラック（オーラル）ペーパーの公式実装 -エージェントレビュー：LLMエージェントとのピアレビューダイナミクスの探索

デモ｜ウェブサイト| ？論文| ？arxiv ｜コード

 @inproceedings { jin2024agentreview ,
  title = { AgentReview: Exploring Peer Review Dynamics with LLM Agents } ,
  author = { Jin, Yiqiao and Zhao, Qinlin and Wang, Yiyang and Chen, Hao and Zhu, Kaijie and Xiao, Yijia and Wang, Jindong } ,
  booktitle = { EMNLP } ,
  year = { 2024 }
}

導入

AgentReviewは、レビューの結果に影響を与える複雑で多変量因子を分析および対処するために開発された、ピアレビュープロセスをシミュレートするための先駆的な大規模な言語モデル（LLM）ベースのフレームワークです。従来の統計的方法とは異なり、AgentReviewは、敏感なピアレビューデータのプライバシーを尊重しながら、潜在変数をキャプチャします。

アカデミックアブストラクト

ピアレビューは、科学的出版物の完全性と進歩の基本です。従来のピアレビュー分析の方法は、しばしばプロセスの多変量性に適切に対処せず、潜在変数を説明し、データのデリケートな性質によりプライバシーの懸念によってさらに制約されている既存のピアレビューデータの探査と統計に依存しています。最初の大規模な言語モデル（LLM）ベースのピアレビューシミュレーションフレームワークであるAgentReviewを紹介します。これは、複数の潜在要因の影響を効果的に解き放ち、プライバシーの問題に対処します。私たちの研究では、社会的影響理論、利他主義疲労、権威の偏見などの社会学的理論によってサポートされているレビュアーの偏見による紙の決定の顕著な37.1％の変動など、重要な洞察が明らかになりました。この研究は、ピアレビューメカニズムの設計を改善するための貴重な洞察を提供できると考えています。

ステージデザインを確認します

はじめる

インストール

データをダウンロードします

このドロップボックスで両方のzipファイルをダウンロードします。

unzip agentreview_paper_data.zip data/ 、それには以下が含まれます。

ペーパーのPDFバージョン
ICLR 2020-2023の現実世界のピアレビュー

unzip AgentReview_Paper_Data.zip -d data/

（オプション）unzip agentReview_llm_reviews.zip under outputs/ 、これにはLLMで生成されたレビューが含まれています（LLM生成データセット）

unzip AgentReview_LLM_Review.zip -d outputs/

必要なパッケージをインストールします：

 cd AgentReview/
pip install -r requirements.txt

環境変数を設定します

Openai APIを使用する場合は、OpenAi_Api_Keyを設定します。

 export OPENAI_API_KEY=... # Format: sk-...

Azureopenai APIを使用する場合は、次のように設定します

 export AZURE_ENDPOINT=...  # Format: https://<your-endpoint>.openai.azure.com/
export AZURE_DEPLOYMENT=...  # Your Azure OpenAI deployment here
export AZURE_OPENAI_KEY=... # Your Azure OpenAI key here

プロジェクトを実行します

run.shに環境変数を設定して実行します。

bash run.sh

注：すべてのプロジェクトファイルは、 AgentReviewディレクトリから実行する必要があります。

デモ

デモはnotebooks/demo.ipynbにあります

独自の環境をカスタマイズします

agentreview/experiment_config.pyに新しい設定を追加してから、 all_settings辞書への新しいエントリとして設定を追加できます。

 all_settings = {
    "BASELINE" : baseline_setting ,
    "benign_Rx1" : benign_Rx1_setting ,
    ...
    " your_setting_name ": your_setting

フレームワークの概要

ステージデザイン

当社のシミュレーションは、構造化された5相パイプラインを採用しています

フェーズI.レビュアー評価。各原稿は、3人のレビュアーによって独立して評価されます。
フェーズII。著者レビューアのディスカッション。著者は、レビュアーの懸念に対処するために反論を提出します。
フェーズIII。レビュアーACディスカッション。このACは、レビュアー間の議論を促進し、最初の評価の更新を促します。
フェーズIV。メタレビューコンパイル。 ACは、議論をメタレビューに合成します。
フェーズV.紙の決定。 ACは、すべての収集された入力に基づいて、論文を受け入れるか拒否するかどうかについて最終決定を下します。

注記

ICLR 2020-2023の実際の受け入れ率に対応する、32％の固定受け入れ率を使用します。詳細については、会議の受け入れ率を参照してください。
APIが厳密なフィルタリングをリクエストに適用できる場合があります。目的の結果を得るには、コンテンツフィルタリングを調整する必要がある場合があります。

ライセンス

このプロジェクトは、Apache-2.0ライセンスの下でライセンスされています。

謝辞

実装は、部分的にChatarenaフレームワークに基づいています。

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-02-27
サイズ 2.35MB
から Github

AgentReview

agentReview

導入

アカデミックアブストラクト

はじめる

インストール

独自の環境をカスタマイズします

フレームワークの概要

ステージデザイン

注記

ライセンス

謝辞

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf