Context based document search
1.0.0
Этот проект предоставляет систему для выполнения контекстного поиска в документах, хранящихся в векторной базе данных. Используя модели встроения OpenAI и Chroma, этот инструмент позволяет эффективно искать в сборе текстовых документов и получить наиболее важные результаты на основе данного запроса.
Python 3.7 или выше
OpenAI API -ключ
Установите необходимые пакеты, работая:
pip install -r requirements.txtgit clone https://github.com/your-username/contextual-documents-search.git cd contextual-documents-searchpython -m venv venv
source venv/bin/activate # On Windows: venvScriptsactivatepip install -r requirements.txtOPENAI_API_KEY = your_openai_api_key Подготовьте каталог файлов .txt , которые вы хотите найти, и поместите их в папку ./resumes или укажите другой каталог в коде.
В вашем основном сценарии создайте экземпляр класса VectorDBHandler и вызовите load_or_create_db() для инициализации векторного хранилища.
from dotenv import load_dotenv
from vector_db_handler import VectorDBHandler
# Load environment variables
load_dotenv ()
# Set up directory paths and collection name
files_directory = "./resumes"
persist_directory = "./vector_db"
collection_name = "resumes_collection"
# Initialize the vector database handler
vector_db_handler = VectorDBHandler ( files_directory , persist_directory , collection_name )
# Load or create the vector store database
vector_db_handler . load_or_create_db ()
# Define the query for the search
query = "I am looking for a software engineer with OpenAI hard skill."
docs = vector_db_handler . query_vector_store ( query )
# Output the top result
if docs :
print ( "Top matching document:" )
print ( docs [ 0 ]. page_content )
else :
print ( "No matching documents found." )