Dieses Projekt zielt darauf ab, eine Weaviate -Datenbanksuche zu untersuchen, wobei Cohere benutzerdefinierte Vektoren generiert werden. Es gibt mehrere Suchanfragen, die wir mit den unten aufgeführten Schritten ausführen:
- Lumpen -Eingabeaufforderung
- Vektorsuche
Sie benötigen Folgendes:
- ein Weaaviate -API -Schlüssel und URL
- eine Cohere -API -Schlüssel
- Installieren Sie virtuelle Env, dann:
pip install -r requirements.txt - Erstellen Sie eine .env -Datei und speichern Sie Ihre Creds
- Testen Sie die DB -Verbindung durch Ausführen:
python database/open_db_connection - Erstellen Sie eine Einbettung für den Datensatz:
python database/create_embeddings
- Dadurch wird ein neues Verzeichnis in Ihrem Root -Verzeichnis namens "Scratch" erstellt.
- Anschließend wird eine .csv -Datei erstellt, die alle von Cohere generierten Vektoren enthält
- Erstellen Sie eine neue Sammlung in Ihrer WeaViate -Instanz:
python database/create_collection
- Dadurch werden eine neue Sammlung namens "MovieCustomVector" erstellt
- Importieren Sie die Daten:
python database/import_data - Abfragen Sie die Daten ab:
python -m queries.{the_file_you_wish_to_query} - Um die DB -Verbindung aus irgendeinem Grund zu beenden:
python database/close_db_connection
Weitere Informationen zu Suchmethoden
Die Lag -Suche, auch bekannt als "generativ", besteht aus 2 Schritten:
- (Weaviate) Führen Sie eine Suchabfrage in Weaviate aus, um relevante Objekte zu finden.
- (Cohere) Verwenden Sie ein Cohere -großer Sprachmodell, um eine Antwort basierend auf den Ergebnissen (aus dem vorherigen Schritt) und der bereitgestellten Eingabeaufforderung oder Aufgabe zu generieren.
Testen von Ruheendpunkten
- Fügen Sie Ihre WCD -REST -Endpunkt -URL in den Browser ein und fügen Sie sie mit
/v1 hinzu - Auf diese Weise werden Ihnen eine Liste der erholsamen Endpunkte angezeigt, auf die Sie den Postboten konfigurieren können.
- Weaviate verwendet ein Trägertoken, und Sie müssen in Ihre WCD_API_KEY zur Autorisierung einfügen