Mesin pencarian dan peringkasan dokumen yang efisien adalah alat yang kuat yang dirancang untuk meningkatkan efisiensi dan kejelasan penelitian dengan mengintegrasikan model bahasa besar (LLM) yang canggih seperti chatgpt dan llama. Proyek ini memanfaatkan teknologi mutakhir untuk memberikan pengalaman pencarian dan ringkasan dokumen yang mulus dan efisien.
Untuk mengatur proyek secara lokal, ikuti langkah -langkah ini:
Klon Repositori :
git clone https://github.com/mananjain02/efficient-document-search-and-summarization-engine.git
cd efficient-document-search-and-summarization-engineBuat lingkungan virtual :
python -m venv venv
source venv/bin/activateInstal dependensi :
pip install -r requirements.txt Mengatur Variabel Lingkungan : Buat file .env di direktori root dan tambahkan pengaturan konfigurasi Anda.
MONGODB_URL = <mongo-db-uri>
SECRET_KEY = <bcrypt-key>
ALGORITHM = " HS256 "
DATABASE = <database-name>
EMBEDDINGS_MODEL = " BAAI/bge-large-en-v1.5 "
VECTOR_DATABASES_FOLDER = " vector_databases "
OPENAI_API_KEY = <open-ai-key-if-want-to-use-chatgpt>
TOKENIZERS_PARALLELISM = " False "Jalankan aplikasi :
uvicorn main:app --reload Dokumentasi API dan perincian lebih lanjut dapat diakses menggunakan Swagger. Setelah aplikasi berjalan, navigasikan ke http://localhost:8000/docs untuk mengeksplorasi dan berinteraksi dengan titik akhir API.