Doc Quest
1.0.0
オフライン環境で社内パッケージを管理しながら、データサイエンスチームにパーソナライズされた参照豊富な出力を提供するために、RAGシステムを設計および最適化するにはどうすればよいですか?
さらに分解するには:
Docquestは、データサイエンスチーム向けに設計されたオフラインの検索上昇(RAG)システムです。インターネット接続のない環境で動作しながら、パーソナライズされた参照が豊富な出力を提供します。このシステムは、データプライバシーが最重要である安全な設定に最適です。
システムは、以下を含む複数のソースからドキュメントを統合します。
DOC-QUEST/
│
├── data/ # Folder for data/documents
│ ├── documents/ # Raw or processed document storage
│ └── vector_db/ # Vector databases
│ ├── child_docs/ # Child documents
│ └── parent_docs/ # Parent documents
│
├── notebooks/ # Jupyter notebooks for prototyping and experimentation
│ ├── 1_documentation_download.ipynb
│ ├── 2_document_pre_processing.ipynb
│ ├── 3_embedding_vector_save_gpu.ipynb
│ ├── 4_conversation_rag.ipynb
│ ├── data_wrangling.ipynb
│ └── rag_v1.ipynb
│
├── src/ # Core source code for pipeline components
│ ├── 1_documentation_download.py
│ ├── 2_document_pre_processing.py
│ ├── 3_embedding_vector_save_gpu.py
│ ├── 4_conversation_rag.py
│
├── .gitignore # Specifies files/folders to ignore in version control
├── doc_quest_app.py # DocQuest UI streamlit application
├── README.md # Project documentation
└── requirements.txt # Dependencies for the project
リポジトリをクローンします:
git clone https://github.com/shrivastavasatyam/Doc-Quest.git
cd Doc-Quest
仮想環境を設定します:
python3 -m venv .venv
source .venv/bin/activate
依存関係をインストールします:
pip install -r requirements.txt
APIキーの構成:GROQ APIキーを環境変数として設定します。
export GROQ_API_KEY=your_groq_api_key
または、 doc_quest_app.pyファイルに直接追加します。
os . environ [ "GROQ_API_KEY" ] = "your_groq_api_key"ドキュメントパスの準備:ドキュメントパスがdoc_quest_app.pyファイルで正しく設定されていることを確認してください:
parent_doc_path = "/path/to/your/parent_docs"
child_doc_path = "./path/to/your/child_docs" Remollitアプリを起動します:
streamlit run doc_quest_app.py
Streamlit(通常http://localhost:8501 )が提供するURLのWebインターフェイスにアクセスします。
チャットインターフェイスを使用して質問をし、RAGシステムと対話します。