image_search Download - image_search Code source Télécharger

image_search

Autre code source

1.0.0

Télécharger

Application de recherche d'image

Intro de projet

L'avènement d'Internet a révolutionné la façon dont nous accédons aux informations via de puissants moteurs de recherche tels que Google, Bing et Yandex. Avec seulement quelques mots clés, nous pouvons trouver rapidement des pages Web pertinentes pour nos requêtes. À mesure que la technologie, en particulier l'IA, les progrès, de nombreux moteurs de recherche facilitent désormais les recherches d'images en ligne.

Diverses techniques de recherche d'images ont émergé, notamment:

Recherche d'image par métadonnées: Ici, la recherche n'est pas basée sur l'image elle-même mais plutôt sur les métadonnées qui suivent l'image comme (mots clés, texte, nom de fichier, date, etc.)
Recherche d'image basée sur le contenu de l'image: cette approche utilise, les techniques de vision informatique de pointe pour extraire la forme, la couleur, toutes les fonctionnalités pertinentes d'une image. C'est la technique que nous allons utiliser.

Dans ce projet, nous utiliserons un réseau neuronal convolutionnel pré-formé (CNN) pour extraire des fonctionnalités précieuses des images. Cette méthodologie, un composant clé de la recherche d'images basée sur le contenu, fournit les avantages suivants:

Les CNN sont robustes: CNN s'est avéré très puissant pour extraire les caractéristiques clés d'une image.
Le CNN peut réduire la dimension: la sortie CNN représente généralement une représentation condensée et pertinente de l'image souvent appelée carte de fonctionnalité ou intégration ou vecteurs , car tous les pixels ne contient pas d'informations significatives. Cette représentation condensée a souvent des dimensions plus petites.

En résumé, dans cette étude, nous aimerons répondre à la question suivante: deux images similaires associées à l'intégration sont-elles toujours similaires?

Technologies / frameworks utilisés

Description du projet

Pour ce projet, nous avons utilisé le CIFAR-10. Il s'agit d'un ensemble de données disponible librement comprenant 60 000 images en couleur, chacune mesurant 32x32 pixels . Ces images appartiennent à 10 catégories distinctes: avion, automobile, oiseau, chat, cerf, chien, grenouille, cheval, navire et camion. Pour obtenir leurs intérêts correspondants, nous avons appliqué un modèle CNN pré-formé, en particulier le VGG-16 , pour extraire des caractéristiques essentielles. Le vecteur résultant est 512-dimension . Dans Pinecone, nous avons créé un index nommé "Images" avec une dimension de 512, où tous ces vecteurs seront stockés.

L'idée derrière ce projet est de trouver si des images similaires d'oiseaux par exemple ont des intégres similaires. Pour ce faire, nous avons téléchargé 50 000 sur le total des 60 000 images associées à l'intégration à un index de poireau. Cette partition a été faite pour nous assurer que nous avons des images entièrement nouvelles et distinctes par rapport à celles déjà stockées en tant que vecteurs en pinone. Notez également que cette partion est déjà effectuée par l'ensemble de données CIFAR-10 dans des lots de train et de test représentant les versions sérialisées des tableaux d'images originaux.

Principe de travail

Le Picutre ci-dessous décrit l'ensemble du processus de stockage des intérêts à un index de pinone. Depuis la première étape de la lecture des images, appliquant un réseau neuronal VGG16 pré-formé pour générer 512 embellis dimensionnels qui sont ensuite mis en place (c'est-à-dire stockés) dans un index de pinone. principe

Temps de course

Dans ce projet, nous gérons 50 000 images, qui posent des défis en termes de compatation, en particulier lors de la lecture d'images, débordant (nous avons réduit la version sérialisée de DataSet CIFAR-10) et extrait les fonctionnalités via un CNN. Nous avons essayé de tirer parti de la puissance de l'informatique parallèle lors de l'exécution de notre code afin que tout fonctionne aussi rapidement que possible sur plusieurs cœurs de CPU via le multithreading.
Remarque: Si possible, exécutez ce projet sur un environnement alimenté par GPU pour des calculs plus rapides.

Commencer

Créez gratuitement un compte PineCone ici.
Obtenez la clé API et l'environnement associé à votre compte de pinone
Clone ce dépôt (pour aider à voir ce tutoriel).
Créez un environnement virtuel dans le dossier du projet (pour aider à voir ce tutoriel).
Exécutez la commande suivante pour installer les packages nécessaires.

Pour les utilisateurs de Linux:

 pip3 install -r requirements.txt

Pour les utilisateurs de Windows:

 pip install -r requirements.txt

Lancez le script d'insertion d'image à l'aide des éléments suivants.

 python insert_data.py -key <API_KEY>  -env <ENV>  -metric <METRIC>

Remplacez <env> et <api_key> par les valeurs que vous obtenez de votre compte PineCone. Attendez que le script soit terminé. 7. Lancez l'application en utilisant les éléments suivants.

 streamlit run app.py -- -key <API_KEY> -env <ENV>

Une fois que tout est fait, vous devriez voir quelque chose comme ceci:

page d'accueil

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-05-31
taille 162.7MB
Provenant de Github

Applications connexes

Bulk Image Downloader

2024-11-10
Recherche de mots 800

2024-11-08
pytorch image models

2024-11-03
galerie d'images moa

2011-09-14
Hôte d'images CF

2011-04-26
ajax-image-uploader

2010-09-29

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout