Эффективный двигатель поиска и суммирования документов - это мощный инструмент, предназначенный для повышения эффективности и ясности исследований путем интеграции передовых моделей крупных языков (LLMS), таких как CHATGPT и Llama. Этот проект использует передовые технологии для обеспечения бесшовного и эффективного опыта поиска и суммирования документов.
Чтобы настроить проект локально, выполните эти шаги:
Клонировать репозиторий :
git clone https://github.com/mananjain02/efficient-document-search-and-summarization-engine.git
cd efficient-document-search-and-summarization-engineСоздайте виртуальную среду :
python -m venv venv
source venv/bin/activateУстановить зависимости :
pip install -r requirements.txt Установите переменные среды : создайте файл .env в корневом каталоге и добавьте настройки конфигурации.
MONGODB_URL = <mongo-db-uri>
SECRET_KEY = <bcrypt-key>
ALGORITHM = " HS256 "
DATABASE = <database-name>
EMBEDDINGS_MODEL = " BAAI/bge-large-en-v1.5 "
VECTOR_DATABASES_FOLDER = " vector_databases "
OPENAI_API_KEY = <open-ai-key-if-want-to-use-chatgpt>
TOKENIZERS_PARALLELISM = " False "Запустите приложение :
uvicorn main:app --reload Доступ к API и дополнительную информацию можно получить с помощью Swagger. Как только приложение запускается, перейдите по http://localhost:8000/docs чтобы исследовать и взаимодействовать с конечными точками API.