rag career portfolio querying
1.0.0
概念データベースに保存されているキャリアポートフォリオデータの自然言語のクエリを可能にする検索された生成(RAG)システム。このシステムは、LlamaindexとOpenaiのEmbedding/LLMサービスを使用して、実務経験、プロジェクト、スキルに関するインテリジェントな対応を提供します。
このシステムは、2つの主要なコンポーネントで構成されています。
ETLパイプライン:概念データベースからデータを抽出し、埋め込みに処理し、ベクターデータベースに保存します
クエリインターフェイス:ポートフォリオデータとの自然言語の相互作用を可能にする流線のWebアプリケーション
notion_data_etl.ipynb :抽出および処理のためのjupyterノートブック概念データ
streamlit_app_rag.py :メインWebアプリケーションインターフェイス
prompts.py :以下のシステムプロンプトが含まれています
包括的なデータ処理クラス:
メインアプリケーションクラス:
NOTION_TOKEN=your_notion_api_token
NOTION_PROJECTS_DATABASE_ID=notion_database_id_for_projects
NOTION_EXPERIENCE_DATABASE_ID=notion_database_id_for_experiences
QDRANT_URL=your_qdrant_url
QDRANT_API_KEY=your_qdrant_api_key
OPENAI_API_KEY=your_openai_api_key
streamlit run streamlit_app_rag.py
システムは、デュアルインデックスアーキテクチャを使用します。
クエリは両方のインデックスを介して処理され、包括的かつ正確な応答を提供します。
システムには、次のことを示す包括的なデバッグパネルが含まれています。