rag career portfolio querying
1.0.0
一個檢索功能的生成(RAG)系統,可實現自然語言查詢存儲在概念數據庫中的職業投資組合數據。該系統使用LlamainDex和OpenAI的Embedding/LLM服務來提供有關工作經驗,項目和技能的明智回答。
該系統由兩個主要組成部分組成:
ETL管道:從概念數據庫中提取數據,將其處理到嵌入中,然後將其存儲在矢量數據庫中
查詢接口:一種簡化的Web應用程序,可以與投資組合數據進行自然語言互動
notion_data_etl.ipynb :用於提取和處理概念數據的jupyter筆記本
streamlit_app_rag.py :主要Web應用程序接口
prompts.py :包含系統提示:
一個全面的數據處理類別:
主應用程序類:
NOTION_TOKEN=your_notion_api_token
NOTION_PROJECTS_DATABASE_ID=notion_database_id_for_projects
NOTION_EXPERIENCE_DATABASE_ID=notion_database_id_for_experiences
QDRANT_URL=your_qdrant_url
QDRANT_API_KEY=your_qdrant_api_key
OPENAI_API_KEY=your_openai_api_key
streamlit run streamlit_app_rag.py
系統使用雙索引體系結構:
通過這兩個索引處理查詢,以提供全面而準確的響應。
該系統包括一個全面的調試面板,顯示: