rag career portfolio querying
1.0.0
개념 데이터베이스에 저장된 커리어 포트폴리오 데이터의 자연어 쿼리를 가능하게하는 RAG (Resprieved-Augmented Generation) 시스템. 이 시스템은 Llamaindex 및 OpenAI의 임베딩/LLM 서비스를 사용하여 업무 경험, 프로젝트 및 기술에 대한 지적 반응을 제공합니다.
이 시스템은 두 가지 주요 구성 요소로 구성됩니다.
ETL 파이프 라인 : 개념 데이터베이스에서 데이터를 추출하고 임베딩으로 처리하고 벡터 데이터베이스에 저장합니다.
쿼리 인터페이스 : 포트폴리오 데이터와 자연 언어 상호 작용을 가능하게하는 간단한 웹 애플리케이션
notion_data_etl.ipynb : 개념 데이터 추출 및 처리를위한 Jupyter 노트북
streamlit_app_rag.py : 기본 웹 응용 프로그램 인터페이스
prompts.py : 시스템 프롬프트를 포함합니다.
포괄적 인 데이터 처리 클래스 :
주요 응용 프로그램 클래스 :
NOTION_TOKEN=your_notion_api_token
NOTION_PROJECTS_DATABASE_ID=notion_database_id_for_projects
NOTION_EXPERIENCE_DATABASE_ID=notion_database_id_for_experiences
QDRANT_URL=your_qdrant_url
QDRANT_API_KEY=your_qdrant_api_key
OPENAI_API_KEY=your_openai_api_key
streamlit run streamlit_app_rag.py
이 시스템은 이중 인덱스 아키텍처를 사용합니다.
쿼리는 두 지수를 통해 처리되어 포괄적이고 정확한 응답을 제공합니다.
이 시스템에는 다음과 같은 포괄적 인 디버그 패널이 포함되어 있습니다.