RAG (Retrieval Audmented Generation) 프로젝트에 오신 것을 환영합니다! ? 이 프로젝트는 Jupyter 노트북 환경에서 Python 코드를 사용하여 Rag의 실제 응용 프로그램을 소개하고 시연하는 것을 목표로합니다. llamaindex는 여기에 사용됩니다. 우리는 걸레를 배우고 실험하는 것이 교육적이고 재미 있어야한다고 생각합니다! ?
이 프로젝트는 여러 폴더로 구성됩니다.
파일 :이 폴더에는 참조에 중요한 파일이 포함되어 있습니다.
readme.md : 현재이 파일을 읽고 있습니다! 프로젝트의 개요를 제공합니다.Intro of Retrieval Augmented Generation (RAG) and application demos_Henry.pdf :이 파일은 배경 정보를 설명하고 RAG를 사용한 실습 실험의 추가 정보를 제공합니다. 시작하기 위해서는 반드시 읽어야합니다! Python_env :이 폴더에는 NLP.yml 파일이 있습니다. 이 YAML 파일을 가져와 코드를 원활하게 실행하기위한 전용 파이썬 환경을 만듭니다.
코드 : code 폴더에는 3 개의 Jupyter 노트북 파일이 포함되어 있으며 각각 다른 실험을 나타냅니다.
1_Basic_RAG_Pipeline.ipynb :이 노트북은 기본 래그 파이프 라인을 보여줍니다. 헝겊의 기본 사항을 이해하기위한 좋은 출발점입니다.2_Sentence_window_retrieval.ipynb :이 노트북은 RAG를 사용하여 문장 창 검색 개념을 탐구합니다. Rag가 특정 컨텍스트 창에서 정보를 검색 할 수있는 방법을 알아보십시오.3_Auto-merging_Retrieval.ipynb :이 노트북에서는 자동 관리 검색과 생성 프로세스를 향상시키는 방법에 대해 배울 것입니다. 흥미 진진한 것들! 데이터 : data 폴더는 검색을 위해 자신의 관심 문서를 저장할 수있는 곳입니다. 현재로서는 Henry.txt 라는 예제 파일이 포함되어 있습니다. Rag를 실험하기 위해 자신의 문서로 자유롭게 바꾸십시오.
공통 :이 폴더 내부에는 openAI.env 파일이 있습니다. 이 파일에 OpenAI API 키를 추가하여 OpenAI 모델과 원활한 상호 작용을 가능하게하는 것을 잊지 마십시오.
헝겊 여행을 시작하려면 다음 단계를 따르십시오.
이 프로젝트 저장소를 로컬 컴퓨터로 복제하거나 다운로드하십시오.
python_env 폴더에서 NLP.yml 파일을 가져와 전용 Python 환경을 만듭니다. 이를 통해 모든 종속성이 올바르게 설치되도록합니다.
common 폴더에서 openAI.env 파일을 열고 OpenAI API 키를 입력하십시오. 이 단계는 OpenAI 모델에 액세스하는 데 중요합니다.
files 폴더의 Intro of Retrieval Augmented Generation (RAG) and application demos_Henry.pdf 읽음으로써 프로젝트에 익숙해 지십시오. 중요한 배경 정보와 실습 실험을 제공합니다.
code 폴더에서 3 개의 Jupyter 노트북 파일 ( 1_Basic_RAG_Pipeline.ipynb , 2_Sentence_window_retrieval.ipynb ) 3_Auto-merging_Retrieval.ipynb 탐색하십시오. 노트를 실행하여 헝겊이 작동하는 것을 볼 수 있습니다!
제공된 예제를 수정하거나 data 폴더에서 자신의 문서를 사용하여 Rag를 실험하십시오. 창의력을 발휘하고 재미있게 보내십시오! ?
축하해요! 당신은 이제 검색 증강 세대 (RAG)를 배우고, 적용하고, 재미있게 보내는 데 필요한 정보와 도구를 갖추고 있습니다. 우리는이 프로젝트가 호기심을 불러 일으키고 제공된 Jupyter 노트북을 사용하여 흥미 진진한 Rag의 세계를 탐험하도록 격려합니다. 행복한 생성! ?
궁금한 점이 있거나 추가 지원이 필요한 경우 주저하지 마십시오. 헝겊 여행을 즐기십시오! ?