documentmentor rag
1.0.0

ドキュメントは、技術ドキュメントアシスタントとして機能するRAG(検索拡張生成)システムです。 RAGアーキテクチャを使用して、このシステムは、OpenAIのGPT-3.5の力をローカルナレッジベースと組み合わせて、スペイン語の技術文書に関する正確でコンテキスト化された応答を提供します。
Python 3.10+ :プロジェクトベース言語
Langchain :RAGシステムの構築のための主なフレームワーク
Openai API :
Rag(検索拡張生成) :
Documentorは、Restreamlitをユーザーインターフェイスのフレームワークとして使用し、次のことを提供します。
インタラクティブなチャット:
ドキュメント管理:
コントロールパネル:
documentmentor/
├── data/ # Datos y almacenamiento
│ ├── processed/ # Documentos procesados
│ ├── vector_store/ # Almacenamiento vectorial
│ │ ├── document_map.json # Mapeo de documentos
│ │ └── faiss.index # Índice FAISS
│ └── documentmentor.db # Base de datos SQLite
│
├── src/ # Código fuente
│ ├── core/ # Lógica principal
│ │ ├── __init__.py
│ │ ├── document_processor.py # Procesamiento de PDFs
│ │ ├── memory_manager.py # Gestión de memoria
│ │ └── qa_engine.py # Motor de Q&A
│ │
│ ├── data/ # Capa de datos
│ │ ├── __init__.py
│ │ ├── database.py # Operaciones SQLite
│ │ └── vector_store.py # Gestión vectorial
│ │
│ └── ui/ # Interfaz de usuario
│ └── app.py # Aplicación Streamlit
│
├── .env # Variables de entorno
├── .env.example # Ejemplo de configuración
├── .gitignore
├── main.py # Punto de entrada
├── README.md
└── requirements.txt # Dependencias
PDF負荷:
インデックス化:
ユーザーの質問:
セマンティック検索:
回答の生成:
準備:
相談:
フォローアップ:
# Core LangChain dependencies
langchain == 0.3 . 12
langchain - core == 0.3 . 25
langchain - community == 0.3 . 12
langchain - openai == 0.2 . 12
openai == 1.57 . 4
# Document Processing
pypdf == 5.1 . 0
python - dotenv == 1.0 . 1
# Vector Store & Embeddings
sentence - transformers == 3.3 . 1
faiss - cpu == 1.9 . 0. post1
torch == 2.5 . 1
torchvision == 0.20 . 1
torchaudio == 2.5 . 1
# Database
SQLAlchemy == 2.0 . 36
# UI Framework
streamlit == 1.41 . 1
# Utils
numpy == 2.2 . 0
pandas == 2.2 . 3
pydantic == 2.10 . 3 git clone https://github.com/Jaolmos/documentmentor-rag.gitpython -m venv venv # Windows
venv S cripts a ctivate
# Linux/Mac
source venv/bin/activatepip install -r requirements.txt # Copiar el archivo de ejemplo
cp .env.example .env
# Editar el archivo .env usando .env.example como referencia
# y añadir tu API key de OpenAI
OPENAI_API_KEY=tu_api_keypython main.py main.pyスクリプトは、次のタスクを実行します。
.envから変数負荷を負荷しますOPENAI_API_KEYの存在を確認しますdata/processed/data/vector_store/ forベクターインデックス