Doc Quest
1.0.0
오프라인 환경에서 사내 패키지를 관리하는 동안 데이터 과학 팀에 맞춤형 참조가 풍부한 출력을 제공하기 위해 RAG 시스템을 설계하고 최적화 할 수 있습니까?
더 나누기 위해 :
DocQuest는 데이터 과학 팀을 위해 설계된 오프라인 검색 세대 (RAG) 시스템입니다. 인터넷 연결이없는 환경에서 작동하는 동안 개인화 된 참조가 풍부한 출력을 제공합니다. 이 시스템은 데이터 개인 정보가 가장 중요한 안전한 설정에 이상적입니다.
이 시스템은 다음을 포함하여 여러 소스의 문서를 통합합니다.
DOC-QUEST/
│
├── data/ # Folder for data/documents
│ ├── documents/ # Raw or processed document storage
│ └── vector_db/ # Vector databases
│ ├── child_docs/ # Child documents
│ └── parent_docs/ # Parent documents
│
├── notebooks/ # Jupyter notebooks for prototyping and experimentation
│ ├── 1_documentation_download.ipynb
│ ├── 2_document_pre_processing.ipynb
│ ├── 3_embedding_vector_save_gpu.ipynb
│ ├── 4_conversation_rag.ipynb
│ ├── data_wrangling.ipynb
│ └── rag_v1.ipynb
│
├── src/ # Core source code for pipeline components
│ ├── 1_documentation_download.py
│ ├── 2_document_pre_processing.py
│ ├── 3_embedding_vector_save_gpu.py
│ ├── 4_conversation_rag.py
│
├── .gitignore # Specifies files/folders to ignore in version control
├── doc_quest_app.py # DocQuest UI streamlit application
├── README.md # Project documentation
└── requirements.txt # Dependencies for the project
저장소 복제 :
git clone https://github.com/shrivastavasatyam/Doc-Quest.git
cd Doc-Quest
가상 환경 설정 :
python3 -m venv .venv
source .venv/bin/activate
종속성 설치 :
pip install -r requirements.txt
API 키 구성 : GROQ API 키를 환경 변수로 설정하십시오.
export GROQ_API_KEY=your_groq_api_key
또는 doc_quest_app.py 파일에 직접 추가하십시오.
os . environ [ "GROQ_API_KEY" ] = "your_groq_api_key" 문서 경로 준비 : 문서 경로가 doc_quest_app.py 파일에 올바르게 설정되었는지 확인하십시오.
parent_doc_path = "/path/to/your/parent_docs"
child_doc_path = "./path/to/your/child_docs" Streamlit 앱을 시작하십시오.
streamlit run doc_quest_app.py
Streamlit (일반적으로 http://localhost:8501 )에서 제공 한 URL에서 웹 인터페이스에 액세스하십시오.
채팅 인터페이스를 사용하여 질문을하고 Rag 시스템과 상호 작용하십시오.