Este proyecto tiene como objetivo explorar la búsqueda de bases de datos tejidas, utilizando Cohere para generar vectores personalizados. Hay varias búsquedas que realizamos utilizando los pasos enumerados a continuación:
- RAPOLO SOLO ANTERIOR
- Búsqueda vectorial
Necesitará lo siguiente:
- una clave de API tejida y URL
- una llave de API de cohere
- Instale Env Virtual Env, luego:
pip install -r requirements.txt - Cree un archivo .env y almacene sus creds
- Pruebe la conexión DB ejecutando:
python database/open_db_connection - Crear una incrustación para el conjunto de datos:
python database/create_embeddings
- Esto creará un nuevo directorio dentro de su directorio raíz llamado 'scratch'.
- Luego creará un archivo .csv que contiene todos los vectores generados por cohere
- Cree una nueva colección en su instancia de tejido:
python database/create_collection
- Esto creará una nueva colección llamada "MoviecustomVector"
- Importar los datos:
python database/import_data - Consulta los datos:
python -m queries.{the_file_you_wish_to_query} - Para terminar la conexión DB por cualquier motivo:
python database/close_db_connection
Más información sobre los métodos de búsqueda
Rag Search, también conocido como 'Generativo', consta de 2 pasos:
- (Weaviate) Ejecute una consulta de búsqueda en Weaviate para encontrar objetos relevantes.
- (Cohere) Use un modelo de lenguaje grande Cohere para generar una respuesta basada en los resultados (del paso anterior) y el aviso o tarea proporcionado.
Prueba de puntos finales de descanso
- Pegue su URL de punto final de reposo WCD en el navegador y agregue con
/v1 - Esto le mostrará una lista de puntos finales RESTful a los que puede acceder configurando Postman.
- Weaviate usa un token de portador, y debe pegar en su wcd_api_key para la autorización