생성 인공 지능 (GENAI) 시스템은 산업 및 연구 환경의 모든 부분에 점점 더 배치되고 있습니다. 개발자와 최종 사용자는 프롬프트 또는 프롬프트 엔지니어링을 사용하여 이러한 시스템과 상호 작용합니다. 프롬프트는 광범위하고 고도로 연구 된 개념이지만, 상충되는 용어와 해당 지역의 NASCENCY로 인한 프롬프트를 구성하는 것에 대한 온톨로지 이해가 좋지 않습니다. 이 저장소는 프롬프트 보고서에 대한 코드입니다. 프롬프트 기술에 대한 분류법을 조립하고 사용을 분석함으로써 프롬프트에 대한 구조적 이해를 확립하는 연구 연구입니다. 이 코드를 사용하면 종이의 자동 검토, 데이터 수집 및 실험 실행이 가능합니다. 우리의 데이터 세트는 포옹 얼굴에서 사용할 수 있으며 논문은 arxiv.org에서 제공됩니다. 정보는 당사 웹 사이트에서도 제공됩니다.
복제 후 루트에서 pip install -r requirements.txt 실행하십시오
root에서 .env 라는 파일을 만듭니다.
Openai 용 : https://platform.openai.com/docs/quickstart
껴안는 얼굴 : https://huggingface.co/docs/hub/security-tokens도 huggingface-cli login 실행하십시오
반 학자 : https://www.semanticscholar.org/product/api#api-key
API 키/토큰을 채우려면 참조 example.env 파일을 사용하십시오.
OPENAI_API_KEY=sk.-...
SEMANTIC_SCHOLAR_API_KEY=...
HF_TOKEN=...
그런 다음 .env 파일을로드하려면 다음을 입력하십시오.
pip install pytest-dotenv
다음을 통해 ENV 파일을 업데이트하도록 선택할 수도 있습니다.
py.test --envfile path/to/.env
여러 .env 파일이있는 경우 Pytest 구성 폴더에 새 ENV_FILES를 작성하고 다음을 입력하십시오.
env_files =
.env
.test.env
.deploy.env
Script main.py 필요한 기능을 호출하여 모든 논문을 다운로드하고, 제거하고 필터링 한 다음 모든 실험을 실행합니다.
저장소의 핵심은 src/prompt_systematic_review 에 있습니다. config_data.py 스크립트에는 실험을 실행하고 시간을 절약하는 데 중요한 구성이 포함되어 있습니다. main.py 에서 이러한 옵션 중 일부가 어떻게 사용되는지 알 수 있습니다.
소스 폴더는 데이터 수집 및 자동 검토 실행을 다루는 3 개의 스크립트 ( automated_review.py , collect_papers.py , config_data.py )로 나뉩니다. 저장소 전반에 사용되는 스크립트를 포함하는 스크립트를 포함하는 스크립트를 포함하는 get_papers 폴더가 포함 된 유틸리티 기능을 포함하는 utils 폴더는 3 개의 스크립트 (Automated_Review.py, experiments , Config_Data.py)로 나뉩니다. 실험.
루트에는 data 폴더가 있습니다. 실험에 사용되는 일부 데이터가 사전로드되지만 대부분의 데이터 세트는 main.py 실행하거나 Hugging Face에서 데이터를 다운로드하여 생성 할 수 있습니다. 실험 결과가 저장되는 것은 data/experiments_output 에 있습니다.
특히 자동 검토/스크래핑 프로세스에 사용되는 키워드는 src/prompt_systematic_review/utils/keywords.py 에 있습니다. 자동 리뷰를 실행하려는 사람은 해당 파일에서 이러한 키워드를 취향에 맞게 조정할 수 있습니다.
git clone https://github.com/trigaten/Prompt_Systematic_Review.git && cd Prompt_Systematic_Review
pip install -r requirements.txt
# create a .env file with your API keys
nano .env
git lfs install
git clone https://huggingface.co/datasets/PromptSystematicReview/ThePromptReport
mv ThePromptReport/ * data/
python main.py main.py 실행하면 논문을 다운로드하고 자동 검토를 실행하며 실험을 실행합니다. 그러나 시간을 절약하고 실험을 실행하려면 Hugging Face에서 데이터를 다운로드하고 데이터 세트의 종이 폴더 및 모든 CSV 파일을 data/papers/*.pdf 및 data/master_papers.csv 등으로 이동해야합니다. 그에 따라 main.py를 조정하십시오.
모든 실험 스크립트에는 main.py 에서 호출되는 run_experiment 함수가 있습니다. run_experiment 함수는 실험을 실행하고 결과 저장을 담당합니다. 그러나 각 스크립트는 python src/prompt_systematic_review/experiments/<experiment_name>.py from root를 실행하여 개별적으로 실행할 수 있습니다.
병렬성과 관련된 이상한 문제로 인해 개별 스크립트로서 루트에서 더 잘 실행되는 graph_internal_references 가 있습니다. 다른 실험과 관련된 문제를 피하기 위해 experiments/__init__.py 의 목록 하단에서 주문하면서 마지막으로 실행됩니다.