Download clip image search - clip image search Quellcode herunterladen

clip image search

Anderer Quellcode

1.0.0

Herunterladen

Bildsuche mit Clip

Abrufen Sie Bilder basierend auf einer Abfrage (Text oder Bild) mit dem vorgezogenen Clip -Modell von Open AI.

Text als Abfrage.

Bild als Abfrage.

Einführung

CLIP (kontrastive Sprachbild vor dem Training) ist ein neuronales Netzwerk, das auf einer Vielzahl von (Bild, Text) ausgebildet ist. Es kann Bilder und Text in denselben latenten Raum abbilden, so dass sie mit einer Ähnlichkeitsmaßnahme verglichen werden können.

Wenn ich die Arbeit in diesem Repository erweiterte, habe ich eine einfache Bildsuchmaschine erstellt, die sowohl Text als auch Bilder als Abfrage aufnehmen kann. Die Suchmaschine funktioniert wie folgt:

Verwenden Sie den Bildcodierer, um den Feature -Vektor der Bilder im Datensatz zu berechnen.

Zeugen Sie die Bilder im folgenden Format:

 image_id: {"url": https://abc.com/xyz, "feature_vector": [0.1, 0.3, ..., 0.2]}

Berechnen Sie den Feature -Vektor der Abfrage. (Verwenden Sie den Text -Encoder, wenn die Abfrage Text ist. Verwenden Sie Bildcodierer, wenn die Abfrage Bild ist.)
Berechnen Sie die Cosinus -Ähnlichkeiten zwischen dem Merkmalsvektor der Abfrage und dem Feature -Vektor der Bilder im Datensatz.
Zurückkehren $ k $ Bilder mit der höchsten Ähnlichkeit.

Ich habe die Lite -Version des UNSPLASH -Datensatzes verwendet, der 25.000 Bilder enthält. Die K-Nearest-Nachbar-Suche wird vom Amazon Elasticsearch-Service angetrieben. Ich habe den Abfragedienst als AWS -Lambda -Funktion eingesetzt und ein API -Gateway davor gestellt. Der Frontend wird mit Stromflächen entwickelt.

Mögliche Verbesserungen

Der von Clip ausgegebene Merkmalsvektor ist ein 32-Bit-Schwimmpunktvektor mit 512 Abmessungen. Um die Speicherkosten zu senken und die Abfragegeschwindigkeit zu erhöhen, können wir eine Dimensionsreduzierungstechnik wie PCA verwenden, um die Anzahl der Funktionen zu verringern. Wenn wir das System auf Milliarden Bilder skalieren möchten, können wir sogar die Binarisierung der Merkmale in Betracht ziehen, wie es in Pinterest geschehen ist.

Wie man benutzt

Abhängigkeiten installieren

 pip install -e . --no-cache-dir

Laden Sie den Unsplash -Datensatz herunter

 python scripts/download_unsplash.py --image_width=480 --threads_count=32

Dadurch wird eine ZIP -Datei heruntergeladen und extrahiert, die die Metadaten über die Fotos im Datensatz enthält. Das Skript verwendet die URLs der Fotos, um die tatsächlichen Bilder auf unsplash-dataset/photos herunterzuladen. Der Download kann für einige Bilder fehlschlagen (siehe dieses Problem). Da Clip die Bilder auf 224 x 224 sowieso abbeispielt, möchten Sie möglicherweise die Breite der heruntergeladenen Bilder anpassen, um den Speicherplatz zu reduzieren. Möglicherweise möchten Sie auch den Parameter threads_count erhöhen, um eine schnellere Leistung zu erzielen.

Erstellen Sie Index- und Image -Funktionsfunktionsvektoren in Elasticsearch

 python scripts/ingest_data.py

Das Skript lädt das vorgezogene Clip -Modell herunter und verarbeitet die Bilder per Batch. Es wird GPU verwenden, wenn es einen gibt.

Bauen Sie das Docker -Bild

Erstellen Sie das Docker -Bild für AWS Lambda.

 docker build --build-arg AWS_ACCESS_KEY_ID=YOUR_AWS_ACCESS_KEY_ID 
             --build-arg AWS_SECRET_ACCESS_KEY=YOUR_AWS_SECRET_ACCESS_KEY 
             --tag clip-image-search 
             --file server/Dockerfile .

Führen Sie das Docker -Bild als Container aus.

 docker run -p 9000:8080 -it --rm clip-image-search

Testen Sie den Container mit einer Postanforderung.

 curl -XPOST "http://localhost:9000/2015-03-31/functions/function/invocations" -d '{"query": "two dogs", "input_type": "text"}'

Führen Sie die Streamlit -App aus

 streamlit run streamlit_app.py

Anerkennung

Open-AI/Clip
Haltakov/natürliche Sprache-Image-Suche

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-03-11
Größe 15.06KB
Kommt von Github

Ähnliche Anwendungen

Wortsuche 800

2024-11-08
Inf CLIP

2024-11-03
Clip-Eimer

2011-05-24
CF-Image-Host

2011-04-26
VSO Image Resizer

2009-06-04
Super Image Plugin

2009-04-18

clip image search

Bildsuche mit Clip

Einführung

Mögliche Verbesserungen

Wie man benutzt

Abhängigkeiten installieren

Laden Sie den Unsplash -Datensatz herunter

Erstellen Sie Index- und Image -Funktionsfunktionsvektoren in Elasticsearch

Bauen Sie das Docker -Bild

Führen Sie die Streamlit -App aus

Anerkennung

Wortsuche 800

Inf CLIP

Clip-Eimer

CF-Image-Host

VSO Image Resizer

Super Image Plugin

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express