Cet exemple montre comment construire une recherche multimodale (image et vidéo) à l'aide de la Meta Ai ImageBind et de la base de données vectorielle Weavate et était basée sur un exemple de Weavate ici.
La requête en utilisant une modalité (par exemple le texte) inclura les résultats dans toutes les modalités disponibles (par exemple les images et la vidéo), car tous les objets seront codés dans un seul espace vectoriel.
Voici un lien vers une vidéo de démonstration que j'ai enregistrée si vous ne voulez pas jouer avec le code.
Le modèle ImageBind n'est disponible qu'avec des déploiements de weavate locaux avec Docker ou Kubernetes.
ImageBind n'est pas pris en charge avec Weavate Services Cloud (WCS).
Installer docker.
Si vous êtes nouveau dans
Docker Compose, voici des instructions sur la façon de l'installer.
Exécutez Weavate + Bind with docker compose
Dans le terminal, accédez au directeur racine de ce projet et localisez le fichier docker-compose.yml et appelez:
docker compose up
Remarque n ° 1 - La première fois que vous exécutez la commande, Docker téléchargera une image ~ 6 Go.
Remarque n ° 2 - L'exécution de cette image Docker nécessite 12 Go de RAM. Si vous êtes sous Windows, vous devrez ajuster votre .wslconfig pour inclure ce qui suit:
[wsl2]
memory=12GB