Ce projet vise à explorer la recherche de base de données WeAviate, en utilisant Cohere pour générer des vecteurs personnalisés. Il y a plusieurs recherches que nous effectuons en utilisant les étapes énumérées ci-dessous:
- Invite unique de chiffon
- Recherche vectorielle
Vous aurez besoin de ce qui suit:
- Une clé API et URL de tivette
- Une clé API Cohere
- Installer Virtual Env, puis:
pip install -r requirements.txt - Créez un fichier .env et stockez vos crédits
- Testez la connexion DB en exécutant:
python database/open_db_connection - Créez des intégres pour l'ensemble de données:
python database/create_embeddings
- Cela créera un nouveau répertoire à l'intérieur de votre répertoire racine appelé «scratch».
- Il créera ensuite un fichier .csv qui contient tous les vecteurs générés par Cohere
- Créez une nouvelle collection dans votre instance de WeAviate:
python database/create_collection
- Cela créera une nouvelle collection intitulée "MovieSustomvector"
- Importez les données:
python database/import_data - Requêtez les données:
python -m queries.{the_file_you_wish_to_query} - Pour terminer la connexion DB pour quelque raison que ce soit:
python database/close_db_connection
Plus d'informations sur les méthodes de recherche
Recherche de chiffon, alias «génératif», se compose de 2 étapes:
- (Weavate) Exécutez une requête de recherche dans Weavate pour trouver des objets pertinents.
- (Cohere) Utilisez un modèle de langue Cohere en grand pour générer une réponse basée sur les résultats (à partir de l'étape précédente) et l'invite ou la tâche fournie.
Tester les points de terminaison de repos
- Collez votre URL de point de terminaison WCD REST dans le navigateur et ajoutez-la avec
/v1 - Cela vous montrera une liste de points de terminaison reposants auxquels vous pouvez accéder en configurant Postman.
- Weavate utilise un jeton de porteur, et vous devez coller dans votre WCD_API_KEY pour l'autorisation