quickstart rag python 다운로드 - quickstart rag python 소스 코드 다운로드

quickstart rag python

기타 소스코드

1.0.0

다운로드

MongoDB 및 LLM 프레임 워크를 사용한 시맨틱 검색

기사 링크

소개

이 Python 프로젝트는 MongoDB와 Langchain 과 Llamaindex의 두 가지 다른 LLM 프레임 워크를 사용한 시맨틱 검색을 보여줍니다. 목표는 MongoDB에서 문서를로드하고 텍스트 데이터에 대한 임베딩을 생성하며 Langchain 및 Llamaindex 프레임 워크를 사용하여 시맨틱 검색을 수행하는 것입니다.

환경 변수

이 프로젝트를 실행하려면 다음 환경 변수를 .env 파일로 설정해야합니다.

 OPENAI_API_KEY = YOUR_OPENAI_API_KEY
MONGODB_URI = YOUR_MONGODB_CONNECTION_URI
MONGODB_COLL = YOUR_MONGODB_COLLECTION
MONGODB_VECTOR_INDEX = YOUR_MONGODB_VECTOR_INDEX
MONGODB_VECTOR_COLL_LANGCHAIN = YOUR_MONGODB_VECTOR_COLLECTION_LANGCHAIN
MONGODB_VECTOR_COLL_LLAMAINDEX = YOUR_MONGODB_VECTOR_COLLECTION_LLAMAINDEX

자리 표시 자 값을 실제 API 키 및 연결 세부 사항으로 바꾸십시오.

설정

종속성 설치 :

 pip install -r requirements.txt

프로젝트 개요

1. 문서로드

프로젝트는 지정된 MongoDB 컬렉션 ( MONGODB_COLL )의 문서를로드합니다. MongoDB 컬렉션에 시맨틱 검색을 수행하려는 텍스트 데이터가 포함되어 있는지 확인하십시오.

2. 임베딩 생성

응용 프로그램은 Langchain 및 Llamaindex 프레임 워크를 사용하여로드 된 텍스트 데이터에 대한 임베딩을 생성합니다. 임베딩은 별도의 mongodb 컬렉션 ( MONGODB_VECTOR_COLL_LANGCHAIN 및 MONGODB_VECTOR_COLL_LLAMAINDEX )에 저장됩니다.

3. 시맨틱 검색

시맨틱 검색은 Langchain 및 Llamaindex 프레임 워크를 사용하여 수행됩니다. 이 과정에는 임베딩 컬렉션을 쿼리하고 프롬프트의 의미 론적 유사성을 기반으로 관련 문서를 검색하는 것이 포함됩니다.

추가 정보

OPENAI_API_KEY 외부 언어 모델 (예 : OpenAi의 GPT)을 사용하여 생성을 포함시키기 위해 필요합니다. MongoDB 연결 세부 정보 및 컬렉션을 적절하게 구성하십시오. 추가 구성 또는 사용법 세부 정보는 Langchain 및 Llamaindex의 공식 문서를 확인하십시오.