生成人工知能(GENAI)システムは、業界および研究環境のすべての部分にますます展開されています。開発者とエンドユーザーは、プロンプトまたはプロンプトエンジニアリングを使用して、これらのシステムと対話します。プロンプトは広範で高度に研究されている概念ですが、対立する用語と、この地域のナスシーのためにプロンプトを構成するものについての存在論的理解が不十分です。このリポジトリは、プロンプトテクニックの分類を組み立て、その使用を分析することにより、プロンプトの構造化された理解を確立する迅速なレポートのコードです。このコードは、論文の自動レビュー、データの収集、および実験の実行を可能にします。私たちのデータセットは抱きしめられた顔で入手でき、私たちの論文はarxiv.orgで入手できます。情報は当社のウェブサイトでも入手できます。
クローニング後、Rootからpip install -r requirements.txtを実行します
rootのファイルを.envと呼びます。
Openaiの場合:https://platform.openai.com/docs/quickstart
顔を抱き締めるために:https://huggingface.co/docs/hub/security-tokens、huggingface-cli huggingface-cli loginも実行します
Sematic Scholarの場合:https://www.semanticscholar.org/product/api#api-key
参照example.envファイルを使用して、APIキー/トークンを入力します。
OPENAI_API_KEY=sk.-...
SEMANTIC_SCHOLAR_API_KEY=...
HF_TOKEN=...
次に、.envファイルをロードするには、入力します。
pip install pytest-dotenv
また、次のことを行うことでENVファイルを更新することもできます。
py.test --envfile path/to/.env
いくつかの.envファイルがある場合、pytest configフォルダーに新しいenv_filesを作成し、タイプします。
env_files =
.env
.test.env
.deploy.env
スクリプトmain.py 、必要な関数を呼び出して、すべての論文をダウンロードし、重複排除してフィルタリングし、すべての実験を実行します。
リポジトリのコアはsrc/prompt_systematic_reviewにあります。 config_data.pyスクリプトには、実験を実行して時間を節約するために重要な構成が含まれています。 main.pyで、これらのオプションの一部がどのように使用されているかを見ることができます。
ソースフォルダーget_papers 、データの収集と自動レビューの実行を扱う3つのスクリプト( automated_review.py 、 collect_papers.py 、 config_data.py )のutilsつのexperimentsセクションに分割されています。実験。
ルートには、 dataフォルダーがあります。実験に使用されるいくつかのデータが事前にロードされていますが、データセットの大部分は、 main.pyを実行するか、顔からデータをダウンロードすることで生成できます。実験の結果が保存されるのはdata/experiments_outputです。
特に、自動化されたレビュー/スクレイピングプロセスで使用されるキーワードはsrc/prompt_systematic_review/utils/keywords.pyにあります。自動化されたレビューを実行したい人なら誰でも、これらのキーワードをそのファイルの好みに合わせて調整できます。
git clone https://github.com/trigaten/Prompt_Systematic_Review.git && cd Prompt_Systematic_Review
pip install -r requirements.txt
# create a .env file with your API keys
nano .env
git lfs install
git clone https://huggingface.co/datasets/PromptSystematicReview/ThePromptReport
mv ThePromptReport/ * data/
python main.py Running main.py論文をダウンロードし、自動レビューを実行し、実験を実行します。ただし、時間を節約したい場合は実験のみを実行する場合は、フェイスを抱き締めるデータをダウンロードして、データセット内のすべてのCSVファイルをデータフォルダーに移動できます( data/master_papers.csv data/papers/*.pdfそれに応じてmain.pyを調整します。
すべての実験スクリプトには、 main.pyで呼び出されるrun_experiment関数があります。 run_experiment関数は、実験を実行し、結果を保存する責任があります。ただし、各スクリプトはpython src/prompt_systematic_review/experiments/<experiment_name>.pyルートから実行するだけで個別に実行できます。
1つの実験、 graph_internal_referencesがあります。これは、並列性の奇妙な問題のために、個々のスクリプトとしてルートからよりよく実行されることです。他の実験で問題を引き起こすことを避けるために、 experiments/__init__.pyでリストの下部に注文されたときに最後に実行されます。