image_search Download - image_search Quellcode herunterladen

image_search

Anderer Quellcode

1.0.0

Herunterladen

Bildsuche App

Projekt Intro

Das Aufkommen des Internets revolutionierte die Art und Weise, wie wir über potente Suchmaschinen wie Google, Bing und Yandex auf Informationen zugreifen. Mit nur wenigen Schlüsselwörtern können wir schnell Webseiten finden, die für unsere Abfragen relevant sind. Als Technologie, insbesondere KI, Fortschritte, ermöglichen viele Suchmaschinen jetzt Online -Image -Suche.

Es wurden verschiedene Techniken zur Bildsuchung aufgetaucht, darunter:

Bildsuche nach Metadaten: Hier basiert die Suche nicht auf dem Bild selbst, sondern auf den Metadaten, die dem Bild folgen (Schlüsselwörter, Text, Dateiname, Datum usw.).
Bildsuche basierend auf Bildinhalt: Dieser Ansatz verwendet, Stand der Kunst Computer Vision -Techniken, um Form, Farbe und relevante Merkmale aus einem Bild zu extrahieren. Dies ist die Technik, die wir verwenden werden.

In diesem Projekt werden wir ein vorgebildetes Faltungsfischnetz (CNN) verwenden, um wertvolle Merkmale aus den Bildern zu extrahieren. Diese Methodik, eine Schlüsselkomponente der inhaltsbasierten Bildsuche, bietet die folgenden Vorteile:

CNN sind robust: CNN hat sich als sehr leistungsfähig erwiesen, um wichtige Merkmale aus einem Bild zu extrahieren.
CNN kann die Dimension verringern: Der CNN -Ausgang stellt typischerweise eine kondensierte, relevante Darstellung des Bildes dar, die häufig als Feature -Karte oder Einbettung oder Vektoren bezeichnet wird, da nicht jedes Pixel signifikante Informationen enthält. Diese kondensierte Darstellung hat oft kleinere Abmessungen.

Zusammenfassend möchten wir in dieser Studie die folgende Frage beantworten: Sind zwei ähnliche Bilder, die die Einbettung miteinander verbunden sind, immer noch ähnlich?

Technologien / Frameworks verwendet

Projektbeschreibung

Für dieses Projekt haben wir die CIFAR-10 verwendet. Es ist ein frei verfügbarer Datensatz, der 60.000 Farbbilder umfasst, die jeweils 32 x 32 Pixel messen. Diese Bilder gehören zu 10 verschiedenen Kategorien: Flugzeug, Auto, Vogel, Katze, Hirsche, Hund, Frosch, Pferd, Schiff und LKW. Um ihre entsprechenden Einbettungen zu erhalten, haben wir ein vorgebildetes CNN-Modell angewendet, insbesondere VGG-16 , um wesentliche Merkmale zu extrahieren. Der resultierende Vektor ist 512-dimensional . Innerhalb von Pinecone haben wir einen Index mit dem Namen "Images" mit einer Dimension von 512 erstellt, in der alle diese Vektoren gespeichert werden.

Die Idee hinter diesem Projekt besteht darin, zu finden, ob ähnliche Bilder von Vögeln beispielsweise ähnliche Einbettungen haben. Zu diesem Zweck haben wir 50.000 der insgesamt 60.000 Bilder zugeordneten Einbettungen in einen Tinecone -Index hochgeladen. Diese Partition wurde durchgeführt, um sicherzustellen, dass wir völlig neue und unterschiedliche Bilder im Vergleich zu den bereits als Vektoren in Tinecone gespeicherten Bildern haben. Beachten Sie auch, dass diese Paritionierung bereits vom CIFAR-10-Datensatz in Zug- und Teststapel durchgeführt wird, die die serialisierten Versionen der Originalbilder-Arrays darstellen.

Arbeitsprinzip

Die folgende Picutre beschreibt den gesamten Prozess des Speicherns der Einbettungen in einen Tinecone -Index. Vom ersten Schritt zum Lesen der Bilder, wenden Sie sich an ein vorgebildetes VGG16-Neuralnetzwerk, um 512 dimensionale Einbettungen zu generieren, die dann in einem Tinecone-Index aufgerichtet (dh gespeichert) werden. Prinzip

Laufzeit

In diesem Projekt behandeln wir 50.000 Bilder, die einige Herausforderungen in Bezug auf die Vergleich darstellen, insbesondere beim Lesen von Bildern, unpickle (wir haben die serialisierte CIFAR-10-Dataset-Version heruntergekommen) und Funktionen über ein CNN extrahieren. Wir haben versucht, die Leistung des Parrallel Computing beim Ausführen unseres Codes so schnell wie möglich auf mehreren CPU -Kernen über Multithreading zu nutzen.
HINWEIS: Führen Sie dieses Projekt in einer GPU -Umgebung für schnellere Berechnungen aus.

Erste Schritte

Erstellen Sie hier kostenlos ein Tinecone -Konto.
Holen Sie sich den API -Schlüssel und die Umgebung, die Ihrem Tinecone -Konto zugeordnet ist
Klonen Sie dieses Repo (für Hilfe dieses Tutorial).
Erstellen Sie eine virtuelle Umgebung im Projektordner (um Hilfe in diesem Tutorial zu erhalten).
Führen Sie den folgenden Befehl aus, um die erforderlichen Pakete zu installieren.

Für Linux -Benutzer:

 pip3 install -r requirements.txt

Für Windows -Benutzer:

 pip install -r requirements.txt

Starten Sie das Bildinsertionsskript mit den folgenden.

 python insert_data.py -key <API_KEY>  -env <ENV>  -metric <METRIC>

Ersetzen Sie <v> und <API_KEY> durch die Werte, die Sie von Ihrem Pinecone -Konto erhalten. Warten Sie, bis das Skript erledigt wird. 7. Starten Sie die App mit den folgenden.

 streamlit run app.py -- -key <API_KEY> -env <ENV>

Sobald alles erledigt ist, sollten Sie so etwas sehen:

Startseite

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-05-31
Größe 162.7MB
Kommt von Github

Ähnliche Anwendungen

Bulk Image Downloader

2024-11-10
Wortsuche 800

2024-11-08
pytorch image models

2024-11-03
Moa-Bildergalerie

2011-09-14
CF-Image-Host

2011-04-26
Ajax-Bild-Uploader

2010-09-29

image_search

Bildsuche App

Projekt Intro

Technologien / Frameworks verwendet

Projektbeschreibung

Arbeitsprinzip

Laufzeit

Erste Schritte

Bulk Image Downloader

Wortsuche 800

pytorch image models

Moa-Bildergalerie

CF-Image-Host

Ajax-Bild-Uploader

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express