Flask Based API for Document Retrieval - Flask Based API for Document Retrieval Descargar

Flask Based API for Document Retrieval

Otro código fuente

1.0.0

Descargar

API basada en frascos para la recuperación de documentos con pinecone, almacenamiento en caché, limitación de tarifas y raspado de fondo

Descripción general del proyecto

Este proyecto es una API basada en frascos diseñada para recuperar documentos utilizando Pinecone para la búsqueda de vectores. Incluye características como:

Almacenamiento en caché para una recuperación más rápida
Limitación de tasas para controlar el uso de API
Raspado de fondo para actualizar periódicamente la base de datos
Dockerización para una fácil implementación y escalabilidad

La aplicación usa:

Pinecone para la recuperación de documentos basada en vectores
Abrazando los transformadores de la cara (Bert) para generar embedidas de texto
Flask-Sqlalchemy para el uso de la API de gestión y seguimiento de los usuarios
Establecimiento de frascos para los resultados de la API de almacenamiento en caché
Limitador frasco para usuarios limitantes de la velocidad
Docker para empacar la aplicación en un entorno contenedorizado

Enfoque y flujo de proyectos

1. Configuración de la API del frasco

Comenzamos configurando los puntos finales básicos de la aplicación Flask y la API:

/health : un punto final simple para verificar si la API se está ejecutando.
/search : un punto final para consultar Pinecone con incrustaciones de texto y recuperar resultados.

2. Incrustación de generación con Bert

Para cada consulta, generamos incrustaciones utilizando un modelo Bert previamente capacitado (a través de la biblioteca de transformers de Hugging Face). Estos incrustaciones se utilizan para realizar búsquedas vectoriales utilizando pinecone.

3. Integración con Pinecone

Integramos Pinecone , una base de datos vectorial, para almacenar y consultar incrustaciones en documentos. Esto permite una recuperación eficiente y rápida de documentos basados en la búsqueda de similitud.

4. Limitación de tarifas y gestión de usuarios

Implementamos la limitación de la tasa utilizando Flask-Limiter para restringir a los usuarios de realizar más de 5 solicitudes por minuto:

Los usuarios se rastrean utilizando una base de datos SQLite con Flask-Sqlalchemy .
Si un usuario excede el límite de velocidad, la API devuelve un error HTTP 429 (demasiadas solicitudes).

5. almacenamiento en caché para una recuperación más rápida

Agregamos el almacenamiento en caché con Flask-Caching . El almacenamiento en caché asegura que se sirvan consultas idénticas de la memoria, lo que reduce la necesidad de presionar la base de datos y el motor de búsqueda vectorial repetidamente. Los resultados en caché caducan después de 5 minutos.

6. Rastreo de fondo

Implementamos un raspador de fondo que puede raspar un sitio web proporcionado por el usuario para artículos o datos y actualizar el índice Pinecone con nuevos documentos:

El raspado es manejado por BeautifulSoup .
La tarea de raspado se ejecuta en segundo plano en un hilo separado y actualiza periódicamente el índice Pinecone.

7. Dockerización

Dockerizamos el proyecto usando un DockerFile . Esto permite que el proyecto se despliegue fácilmente en cualquier entorno con un comportamiento consistente en diferentes sistemas.

Características

Recuperación de documentos : recupere documentos basados en la búsqueda de similitud utilizando incrustaciones.
Limitación de tarifas : prevenir el abuso de API al limitar las solicitudes a 5 por minuto por usuario.
ACCIÓN : AL CACHA Los resultados de consultas similares para tiempos de respuesta más rápidos.
Gestión del usuario : rastrear el número de llamadas API realizadas por cada usuario.
Raspado de fondo : raspar sitios web en segundo plano para actualizar continuamente el índice Pinecone.
Dockerización : ejecute fácilmente e implementa la aplicación usando Docker.

Estructura de proyectos

 project/
├── app.py               # Main Flask application
├── database.py          # Database setup for user management
├── cache.py             # Caching configuration
├── limiter.py           # Rate limiting configuration
├── utils.py             # Utility functions (embedding, Pinecone query)
├── scraping.py          # Background scraping logic
├── requirements.txt     # Python dependencies
├── Dockerfile           # Docker configuration
├── .env                 # Environment variables (not committed to version control)
├── .dockerignore        # Ignore unnecessary files in the Docker build
└── README.md            # Project documentation

Archivos clave:

app.py : contiene la aplicación Flask y todas las rutas API.
database.py : maneja la configuración y el esquema para la administración de usuarios utilizando SQLite.
cache.py : gestiona el almacenamiento en caché para tiempos de respuesta más rápidos.
limiter.py : implementa la funcionalidad limitante de la velocidad.
utils.py : proporciona funciones auxiliares para generar integridades y consultar Pinecone.
scraping.py : contiene la lógica para rasparse y actualizar el índice Pinecone.
Dockerfile : se usa para construir y ejecutar la aplicación en un contenedor Docker.

Configuración e instalación

Prerrequisitos:

Python 3.9+
Estibador

Paso 1: Clonar el repositorio

 git clone <repository-url>
cd project

Paso 2: Configure un entorno virtual (opcional pero recomendado)

 python -m venv venv
source venv/bin/activate  # On Windows, use venvScriptsactivate

Paso 3: instalar las dependencias

 pip install -r requirements.txt

Paso 4: Configurar variables de entorno

Cree un archivo .env en la raíz del proyecto y agregue su tecla y entorno API de Pinecone:

 PINECONE_API_KEY=your_pinecone_api_key
PINECONE_ENVIRONMENT=your_pinecone_environment

Paso 5: Inicializar la base de datos

Para configurar la base de datos, ejecute el siguiente código:

 >>> from app import db, app
>>> with app.app_context():
>>>     db.create_all()

Paso 6: ejecute la aplicación

 python app.py

La aplicación se ejecutará en http://localhost:5000 .

Configuración de Docker

Paso 1: Construya la imagen de Docker

 docker build -t flask-app .

Paso 2: Ejecute el contenedor Docker

 docker run -p 5000:5000 flask-app

Ahora, su aplicación se ejecutará en http://localhost:5000 .

Puntos finales de API

Cheque de salud

URL : /health Método de salud: GET descripción : comprobaciones si la API se está ejecutando. Respuesta :

 json
Copy code
{
  "status": "API is running"
}

Buscar

URL : /search Método de búsqueda: Descripción POST : Documentos de búsqueda basados en consultas de texto. Solicitud de cuerpo :

 json
Copy code
{
  "query": "Your search query",
  "user_id": "user123",
  "top_k": 3
}

Respuesta : Devuelve una lista de documentos coincidentes basados en la consulta.

Comience a desechar URL : /start_scraping Método : POST Descripción : Inicie el proceso de raspado de fondo para un sitio específico. Solicitud de cuerpo :

 json
Copy code
{
  "url": "https://example.com"
}

Respuesta :

 json

{
  "message": "Started scraping for https://example.com"
}

Solución de problemas

Problemas comunes:

Límite de tasa excedido: si alcanza el límite de velocidad, la API devolverá un error 429.
Retraso en caché: si se devuelven los resultados en caché, es posible que deba esperar 5 minutos antes de que aparezcan nuevos resultados.
Registros: la aplicación registra todas las solicitudes y errores en api.log . Los registros de raspado de fondo se escriben en raspado.log.

Mejoras futuras

Autenticación: Agregar autenticación basada en claves API para mayor seguridad.
Manejo de errores mejorados: mensajes de error más detallados para consultas no válidas o fallas de desguace.
Soporte para múltiples sitios de raspado: mejore el raspador para manejar múltiples sitios en paralelo.

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-05-30
tamaño 15.66KB
Proviene de Github

Aplicaciones relacionadas

Youtube dl api

2024-11-05
sample node api

2024-11-05
aspera api examples

2024-11-04
Enhanced Blockchain Based Decentralized Public Auditing for Cloud Storage

2024-11-04
Retrieval based Voice Conversion WebUI

2024-11-01
jQuery 1.2 API versión china

2009-05-29

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo