기사 링크
이 Python 프로젝트는 MongoDB와 Langchain 과 Llamaindex의 두 가지 다른 LLM 프레임 워크를 사용한 시맨틱 검색을 보여줍니다. 목표는 MongoDB에서 문서를로드하고 텍스트 데이터에 대한 임베딩을 생성하며 Langchain 및 Llamaindex 프레임 워크를 사용하여 시맨틱 검색을 수행하는 것입니다.
이 프로젝트를 실행하려면 다음 환경 변수를 .env 파일로 설정해야합니다.
OPENAI_API_KEY = YOUR_OPENAI_API_KEY
MONGODB_URI = YOUR_MONGODB_CONNECTION_URI
MONGODB_COLL = YOUR_MONGODB_COLLECTION
MONGODB_VECTOR_INDEX = YOUR_MONGODB_VECTOR_INDEX
MONGODB_VECTOR_COLL_LANGCHAIN = YOUR_MONGODB_VECTOR_COLLECTION_LANGCHAIN
MONGODB_VECTOR_COLL_LLAMAINDEX = YOUR_MONGODB_VECTOR_COLLECTION_LLAMAINDEX자리 표시 자 값을 실제 API 키 및 연결 세부 사항으로 바꾸십시오.
종속성 설치 :
pip install -r requirements.txt
프로젝트는 지정된 MongoDB 컬렉션 ( MONGODB_COLL )의 문서를로드합니다. MongoDB 컬렉션에 시맨틱 검색을 수행하려는 텍스트 데이터가 포함되어 있는지 확인하십시오.
응용 프로그램은 Langchain 및 Llamaindex 프레임 워크를 사용하여로드 된 텍스트 데이터에 대한 임베딩을 생성합니다. 임베딩은 별도의 mongodb 컬렉션 ( MONGODB_VECTOR_COLL_LANGCHAIN 및 MONGODB_VECTOR_COLL_LLAMAINDEX )에 저장됩니다.
시맨틱 검색은 Langchain 및 Llamaindex 프레임 워크를 사용하여 수행됩니다. 이 과정에는 임베딩 컬렉션을 쿼리하고 프롬프트의 의미 론적 유사성을 기반으로 관련 문서를 검색하는 것이 포함됩니다.
OPENAI_API_KEY 외부 언어 모델 (예 : OpenAi의 GPT)을 사용하여 생성을 포함시키기 위해 필요합니다. MongoDB 연결 세부 정보 및 컬렉션을 적절하게 구성하십시오. 추가 구성 또는 사용법 세부 정보는 Langchain 및 Llamaindex의 공식 문서를 확인하십시오.