rag career portfolio querying
1.0.0
一个检索功能的生成(RAG)系统,可实现自然语言查询存储在概念数据库中的职业投资组合数据。该系统使用LlamainDex和OpenAI的Embedding/LLM服务来提供有关工作经验,项目和技能的明智回答。
该系统由两个主要组成部分组成:
ETL管道:从概念数据库中提取数据,将其处理到嵌入中,然后将其存储在矢量数据库中
查询接口:一种简化的Web应用程序,可以与投资组合数据进行自然语言互动
notion_data_etl.ipynb :用于提取和处理概念数据的jupyter笔记本
streamlit_app_rag.py :主要Web应用程序接口
prompts.py :包含系统提示:
一个全面的数据处理类别:
主应用程序类:
NOTION_TOKEN=your_notion_api_token
NOTION_PROJECTS_DATABASE_ID=notion_database_id_for_projects
NOTION_EXPERIENCE_DATABASE_ID=notion_database_id_for_experiences
QDRANT_URL=your_qdrant_url
QDRANT_API_KEY=your_qdrant_api_key
OPENAI_API_KEY=your_openai_api_key
streamlit run streamlit_app_rag.py
系统使用双索引体系结构:
通过这两个索引处理查询,以提供全面而准确的响应。
该系统包括一个全面的调试面板,显示: