Este proyecto para llevar a casa ha sido diseñado en un plazo de menos de 72 horas, sirviendo como un paso en el proceso de contratación para un rol de MLOPS senior.
PDF Bundle es una herramienta diseñada para extraer texto de los documentos PDF almacenados en un cubo de AWS S3, desglose estos documentos en piezas más pequeñas y generar incrustaciones de vectores utilizando el transformador de oraciones. Estas integridades se almacenan en una base de datos de vectores de piña para almacenamiento y recuperación eficientes.
PDF Bundle proporciona una interfaz fácil de usar a través de Fastapi. El punto final query_search facilita las búsquedas basadas en el aviso, lo que permite a los usuarios ingresar consultas y recuperar rápidamente los incrustaciones vectoriales más similares. Esta similitud se determina utilizando la similitud de coseno, una medida que captura la similitud semántica entre los vectores. Si bien simplifica la respuesta para la usabilidad, el paquete PDF garantiza la transparencia cargando automáticamente respuestas detalladas al cubo S3. Con su integración perfecta y su funcionalidad robusta, el paquete PDF descubre de manera eficiente las integridades vectoriales más similares.
Asegúrese de que el servidor de API de paquete PDF se esté ejecutando en el siguiente servidor:
La aplicación es implementada y accesible en: ferrocarril.
ADVERTENCIA: Retraso de giro de instancia libre
Tenga en cuenta que la instancia libre proporcionada por Render puede experimentar el spin-down debido a la inactividad. Esto podría dar lugar a retrasos de 50 segundos o más al procesar solicitudes. Sea paciente mientras su navegador web intenta cargar la página.
Envíe una solicitud de publicación al punto final de API /query_search con la siguiente carga útil JSON:
{
"prompt" : " your_user_defined_prompt " ,
"n_top" : 5
} Reemplace "your_user_defined_prompt" con el aviso que desea usar, "n_top" con la cantidad de integridades similares que desea recuperar en función de la SimUality de coseno.
Reciba una respuesta que contenga los incrustaciones más similares al mensaje proporcionado.
¡Las contribuciones son bienvenidas! No dude en enviar una solicitud de extracción o abrir un problema si encuentra algún error o tiene sugerencias de mejoras.
Para cualquier consulta o soporte, comuníquese con [email protected]