Contoh ini menunjukkan cara membangun pencarian multi-modal (gambar dan video) menggunakan meta AI ImageBind dan Weaviate Vector Database dan didasarkan pada contoh dari Weaviate di sini.
Permintaan menggunakan satu modalitas (misalnya teks) akan mencakup hasil dalam semua modalitas yang tersedia (misalnya gambar dan video), karena semua objek akan dikodekan ke dalam ruang vektor tunggal.
Berikut adalah tautan ke video demo yang saya rekam jika Anda tidak ingin bermain dengan kode.
Model ImageBind hanya tersedia dengan penyebaran Weaviate lokal dengan Docker atau Kubernetes.
ImageBind tidak didukung dengan Weaviate Cloud Services (WCS).
Instal Docker.
Jika Anda baru mengenal
Docker Compose, berikut adalah instruksi tentang cara menginstalnya.
Jalankan Weaviate+Bind dengan Docker Compose
Di terminal, navigasikan ke direktur root dari proyek ini dan temukan file docker-compose.yml dan hubungi:
docker compose up
Catatan #1 - Pertama kali Anda menjalankan perintah, Docker akan mengunduh gambar ~ 6GB.
Catatan #2 - Menjalankan gambar Docker ini membutuhkan RAM 12GB. Jika Anda berada di Windows, Anda harus menyesuaikan .WSLConfig Anda untuk memasukkan yang berikut:
[wsl2]
memory=12GB