clip image search

clip image search

Другой исходный код

1.0.0

Скачать

Поиск изображения с помощью клипа

Получите изображения на основе запроса (текст или изображение), используя открытую модель клипа Open AI.

Текст как запрос.

Изображение как запрос.

Введение

Clip (контрастный языковой предварительный тренировки)-это нейронная сеть, обучаемая различным парам (изображение, текст). Он может отображать изображения и текст в одно и то же скрытое пространство, чтобы их можно было сравнить, используя меру сходства.

Расширяя работу в этом репозитории, я создал простую поисковую систему изображения, которая может принимать как текст, так и изображения в качестве запроса. Поисковая система работает следующим образом:

Используйте энкодер изображения, чтобы вычислить вектор функций изображений в наборе данных.
Индексировать изображения в следующем формате:
```
 image_id: {"url": https://abc.com/xyz, "feature_vector": [0.1, 0.3, ..., 0.2]}
```
Вычислите вектор функции запроса. (Используйте Text Encoder, если запрос - это текст. Используйте Emage Encoder, если запрос - изображение.)
Вычислите сходство косинуса между вектором функций запроса и вектором функций изображений в наборе данных.
Возвращаться $ k $ Изображения, которые имеют самое высокое сходство.

Я использовал версию Lite of Unsplash DataSet, которая содержит 25 000 изображений. Поиск K-ближайшего соседа работает на Amazon Elasticsearch Service. Я развернул службу запросов в качестве функции AWS Lambda и поместил перед ней шлюз API. Фронт разработан с использованием потока.

Возможные улучшения

Вектор функций, выведенный Clip, представляет собой 32-разрядный вектор с плавающей запятой с 512 измерениями. Чтобы снизить стоимость хранения и увеличить скорость запроса, мы можем рассмотреть возможность использования методики сокращения измерений, такой как PCA, для уменьшения количества функций. Если мы хотим масштабировать систему до миллиардов изображений, мы можем даже рассмотреть вопрос о бинаризации функций, как это сделано в Pinterest.

Как использовать

Установить зависимости

 pip install -e . --no-cache-dir

Загрузите набор данных Unsplash

 python scripts/download_unsplash.py --image_width=480 --threads_count=32

Это загрузит и извлечет zip -файл, который содержит метаданные о фотографиях в наборе данных. The script will use the URLs of the photos to download the actual images to unsplash-dataset/photos . Загрузка может пройти в неудаче для нескольких изображений (см. Эта проблема). Поскольку Clip в любом случае понизит изображения до 224 x 224, вы можете настроить ширину загруженных изображений, чтобы уменьшить пространство для хранения. You may also want to increase the threads_count parameter to achieve a faster performance.

Создайте индекс и загрузку векторов изображения в Elasticsearch

 python scripts/ingest_data.py

Сценарий загрузит предварительную модель клипа и обрабатывает изображения с помощью партии. Он будет использовать GPU, если есть один.

Стройте изображение Docker

Стройте изображение Docker для AWS Lambda.

 docker build --build-arg AWS_ACCESS_KEY_ID=YOUR_AWS_ACCESS_KEY_ID 
             --build-arg AWS_SECRET_ACCESS_KEY=YOUR_AWS_SECRET_ACCESS_KEY 
             --tag clip-image-search 
             --file server/Dockerfile .

Запустите изображение Docker как контейнер.

 docker run -p 9000:8080 -it --rm clip-image-search

Проверьте контейнер с помощью запроса Post.

 curl -XPOST "http://localhost:9000/2015-03-31/functions/function/invocations" -d '{"query": "two dogs", "input_type": "text"}'

Запустите приложение Streamlit

 streamlit run streamlit_app.py

Подтверждение

Open-AI/Clip
Haltakov/Natural Language-Image-Search

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-03-11
размер 15.06KB
От Github

Связанные приложения

Поиск слов 800

2024-11-08
Inf CLIP

2024-11-03
Клип Ведро

2011-05-24
Хост изображений CF

2011-04-26
Изменение размера изображения VSO

2009-06-04
Плагин «Суперизображение»

2009-04-18

clip image search

Поиск изображения с помощью клипа

Введение

Возможные улучшения

Как использовать

Установить зависимости

Загрузите набор данных Unsplash

Создайте индекс и загрузку векторов изображения в Elasticsearch

Стройте изображение Docker

Запустите приложение Streamlit

Подтверждение

Поиск слов 800

Inf CLIP

Клип Ведро

Хост изображений CF

Изменение размера изображения VSO

Плагин «Суперизображение»

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express