El eficiente motor de búsqueda y resumen de documentos es una herramienta poderosa diseñada para mejorar la eficiencia y la claridad de la investigación mediante la integración de modelos avanzados de idiomas grandes (LLM) como CHATGPT y LLAMA. Este proyecto aprovecha las tecnologías de vanguardia para proporcionar una experiencia de búsqueda y resumen de documentos perfecta y eficiente.
Para configurar el proyecto localmente, siga estos pasos:
Clon el repositorio :
git clone https://github.com/mananjain02/efficient-document-search-and-summarization-engine.git
cd efficient-document-search-and-summarization-engineCrear un entorno virtual :
python -m venv venv
source venv/bin/activateInstalar dependencias :
pip install -r requirements.txt Configurar variables de entorno : cree un archivo .env en el directorio raíz y agregue su configuración de configuración.
MONGODB_URL = <mongo-db-uri>
SECRET_KEY = <bcrypt-key>
ALGORITHM = " HS256 "
DATABASE = <database-name>
EMBEDDINGS_MODEL = " BAAI/bge-large-en-v1.5 "
VECTOR_DATABASES_FOLDER = " vector_databases "
OPENAI_API_KEY = <open-ai-key-if-want-to-use-chatgpt>
TOKENIZERS_PARALLELISM = " False "Ejecute la aplicación :
uvicorn main:app --reload Se puede acceder a la documentación de la API y a más detalles utilizando Swagger. Una vez que la aplicación se ejecute, navegue a http://localhost:8000/docs para explorar e interactuar con los puntos finales de la API.