clip image searchダウンロード - clip image searchソースコードのダウンロード

clip image search

その他のソースコード

1.0.0

ダウンロード

クリップを使用した画像検索

Open AIの前提条件のクリップモデルを使用して、クエリ（テキストまたは画像）に基づいて画像を取得します。

クエリとしてのテキスト。

クエリとしての画像。

導入

Clip（コントラスト型言語イメージのプリトレーニング）は、さまざまな（画像、テキスト）ペアでトレーニングされたニューラルネットワークです。画像とテキストを同じ潜在スペースにマッピングすることで、類似性測定を使用して比較できます。

このリポジトリで作業を拡張して、テキストと画像の両方をクエリとして使用できるシンプルな画像検索エンジンを作成しました。検索エンジンは次のように機能します。

画像エンコーダーを使用して、データセット内の画像の機能ベクトルを計算します。

次の形式で画像をインデックス化します。

 image_id: {"url": https://abc.com/xyz, "feature_vector": [0.1, 0.3, ..., 0.2]}

クエリの機能ベクトルを計算します。（クエリがテキストの場合はテキストエンコーダーを使用します。クエリが画像の場合は画像エンコーダーを使用します。）
クエリの特徴ベクトルとデータセット内の画像の特徴ベクトルとの間のコサインの類似性を計算します。
戻る $ k $類似性が最も高い画像。

25,000の画像を含むUnsplashデータセットのLiteバージョンを使用しました。 K-nearest Neighbor Searchは、Amazon Elasticsearch Serviceを搭載しています。 AWS Lambda関数としてクエリサービスを展開し、その前にAPIゲートウェイを配置しました。フロントエンドは、Riremlitを使用して開発されています。

考えられる改善

クリップによって出力される機能ベクトルは、512寸法の32ビットの浮動小数点ベクトルです。ストレージコストを削減し、クエリ速度を上げるために、PCAなどの寸法削減手法を使用して機能の数を減らすことを検討する場合があります。システムを数十億の画像にスケーリングしたい場合は、Pinterestで行われているように、機能をバイナリングすることさえ検討することもできます。

使い方

依存関係をインストールします

 pip install -e . --no-cache-dir

Unsplashデータセットをダウンロードします

 python scripts/download_unsplash.py --image_width=480 --threads_count=32

これにより、データセット内の写真に関するメタデータを含むzipファイルをダウンロードして抽出します。スクリプトは、写真のURLを使用して、実際の画像をunsplash-dataset/photosにダウンロードします。ダウンロードはいくつかの画像で失敗する可能性があります（この問題を参照）。クリップはとにかく224 x 224に画像をダウンサンプリングするため、ダウンロードした画像の幅を調整してストレージスペースを削減することをお勧めします。また、 threads_countパラメーターを増やして、より速いパフォーマンスを実現することもできます。

インデックスを作成し、画像機能ベクトルをElasticSearchにアップロードします

 python scripts/ingest_data.py

スクリプトは、前処理されたクリップモデルをダウンロードし、バッチで画像を処理します。ある場合はGPUを使用します。

Docker画像を作成します

AWS LambdaのDocker画像を構築します。

 docker build --build-arg AWS_ACCESS_KEY_ID=YOUR_AWS_ACCESS_KEY_ID 
             --build-arg AWS_SECRET_ACCESS_KEY=YOUR_AWS_SECRET_ACCESS_KEY 
             --tag clip-image-search 
             --file server/Dockerfile .

docker画像をコンテナとして実行します。

 docker run -p 9000:8080 -it --rm clip-image-search

ポストリクエストでコンテナをテストします。

 curl -XPOST "http://localhost:9000/2015-03-31/functions/function/invocations" -d '{"query": "two dogs", "input_type": "text"}'

Riremlitアプリを実行します

 streamlit run streamlit_app.py

了承

オープンアイ/クリップ
Haltakov/Natural-Language-Image-Search

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-03-11
サイズ 15.06KB
から Github

clip image search

クリップを使用した画像検索

導入

考えられる改善

使い方

依存関係をインストールします

Unsplashデータセットをダウンロードします

インデックスを作成し、画像機能ベクトルをElasticSearchにアップロードします

Docker画像を作成します

Riremlitアプリを実行します

了承

単語検索 800

Inf CLIP

クリップバケット

CFイメージホスト

VSO 画像リサイザー

スーパーイメージプラグイン

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express