Context based document search
1.0.0
Proyek ini menyediakan sistem untuk melakukan pencarian berbasis konteks di seluruh dokumen yang disimpan dalam database vektor. Menggunakan model embedding OpenAI dan Chroma, alat ini memungkinkan Anda untuk mencari secara efisien melalui kumpulan dokumen teks dan mengambil hasil yang paling relevan berdasarkan kueri yang diberikan.
Python 3.7 atau lebih tinggi
Kunci API Openai
Instal paket yang diperlukan dengan menjalankan:
pip install -r requirements.txtgit clone https://github.com/your-username/contextual-documents-search.git cd contextual-documents-searchpython -m venv venv
source venv/bin/activate # On Windows: venvScriptsactivatepip install -r requirements.txtOPENAI_API_KEY = your_openai_api_key Siapkan direktori file .txt yang ingin Anda cari dan letakkan di folder ./resumes atau tentukan direktori yang berbeda dalam kode.
Dalam skrip utama Anda, instantiate kelas VectorDBHandler dan hubungi load_or_create_db() untuk menginisialisasi toko vektor.
from dotenv import load_dotenv
from vector_db_handler import VectorDBHandler
# Load environment variables
load_dotenv ()
# Set up directory paths and collection name
files_directory = "./resumes"
persist_directory = "./vector_db"
collection_name = "resumes_collection"
# Initialize the vector database handler
vector_db_handler = VectorDBHandler ( files_directory , persist_directory , collection_name )
# Load or create the vector store database
vector_db_handler . load_or_create_db ()
# Define the query for the search
query = "I am looking for a software engineer with OpenAI hard skill."
docs = vector_db_handler . query_vector_store ( query )
# Output the top result
if docs :
print ( "Top matching document:" )
print ( docs [ 0 ]. page_content )
else :
print ( "No matching documents found." )