تنزيل clip image search - clip image search

clip image search

شفرة المصدر الأخرى

1.0.0

تنزيل

البحث عن الصور باستخدام مقطع

استرجاع الصور بناءً على استعلام (نص أو صورة) ، باستخدام نموذج مقطع Open AI PretRained.

النص كاستعلام.

الصورة كاستعلام.

مقدمة

المقطع (صورة اللغة المتباينة قبل التدريب) هو شبكة عصبية مدربة على مجموعة متنوعة من أزواج (الصورة والنص). يمكنه تعيين الصور والنص على نفس المساحة الكامنة ، بحيث يمكن مقارنتها باستخدام مقياس التشابه.

تمديد العمل في هذا المستودع ، قمت بإنشاء محرك بحث بسيط عن الصور يمكنه التقاط النص والصور كاستعلام. يعمل محرك البحث على النحو التالي:

استخدم تشفير الصور لحساب متجه الميزة في الصور في مجموعة البيانات.

فهرس الصور بالتنسيق التالي:

 image_id: {"url": https://abc.com/xyz, "feature_vector": [0.1, 0.3, ..., 0.2]}

حساب متجه ميزة الاستعلام. (استخدم ترميز النص إذا كان الاستعلام هو نص. استخدم Encoder Iffice إذا كان الاستعلام صورة.)
قم بحساب أوجه تشابه جيب التمام بين متجه الميزة للاستعلام ومتجه الميزة للصور في مجموعة البيانات.
يعود $ k $ الصور التي لها أعلى تشابه.

لقد استخدمت إصدار Lite من مجموعة بيانات Unsplash التي تحتوي على 25000 صورة. يتم تشغيل البحث الجار K-neary بواسطة خدمة Amazon Elasticsearch. لقد نشرت خدمة الاستعلام كدالة AWS Lambda ووضعت بوابة API أمامها. تم تطوير الواجهة الأمامية باستخدام STIPLELIT.

التحسينات المحتملة

المتجه الميزة الذي تم إخراجه بواسطة المقطع هو متجه نقطة عائم 32 بت مع 512 أبعاد. لتقليل تكلفة التخزين وزيادة سرعة الاستعلام ، قد نفكر في استخدام تقنية تقليل الأبعاد مثل PCA لتقليل عدد الميزات. إذا كنا نريد توسيع نطاق النظام لمليارات الصور ، فقد نفكر حتى في تنسيق الميزات ، كما هو الحال في Pinterest.

كيفية استخدام

تثبيت التبعيات

 pip install -e . --no-cache-dir

قم بتنزيل مجموعة بيانات Unsplash

 python scripts/download_unsplash.py --image_width=480 --threads_count=32

سيؤدي ذلك إلى تنزيل واستخراج ملف مضغوط يحتوي على البيانات الوصفية حول الصور الموجودة في مجموعة البيانات. سيستخدم البرنامج النصي عناوين URL الخاصة بالصور لتنزيل الصور الفعلية unsplash-dataset/photos . قد يفشل التنزيل في بعض الصور (انظر هذه المشكلة). نظرًا لأن Clip سيقوم بإسقاط الصور إلى 224 × 224 على أي حال ، فقد ترغب في ضبط عرض الصور التي تم تنزيلها لتقليل مساحة التخزين. قد ترغب أيضًا في زيادة معلمة threads_count لتحقيق أداء أسرع.

إنشاء فهرس وتحميل مصادف ميزة الصورة إلى Elasticsearch

 python scripts/ingest_data.py

سيقوم البرنامج النصي بتنزيل نموذج المقطع المسبق ومعالجة الصور بواسطة الدفعة. سوف يستخدم GPU إذا كان هناك واحد.

بناء صورة Docker

بناء صورة Docker لـ AWS Lambda.

 docker build --build-arg AWS_ACCESS_KEY_ID=YOUR_AWS_ACCESS_KEY_ID 
             --build-arg AWS_SECRET_ACCESS_KEY=YOUR_AWS_SECRET_ACCESS_KEY 
             --tag clip-image-search 
             --file server/Dockerfile .

قم بتشغيل صورة Docker كحاوية.

 docker run -p 9000:8080 -it --rm clip-image-search

اختبر الحاوية مع طلب البريد.

 curl -XPOST "http://localhost:9000/2015-03-31/functions/function/invocations" -d '{"query": "two dogs", "input_type": "text"}'

تشغيل تطبيق STREMLIT

 streamlit run streamlit_app.py

شكر وتقدير

Open-AI/CLIP
Haltakov/Natural Language-Disage-Search

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-03-11
الحجم 15.06KB
من Github

تطبيقات ذات صلة

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل

clip image search

البحث عن الصور باستخدام مقطع

مقدمة

التحسينات المحتملة

كيفية استخدام

تثبيت التبعيات

قم بتنزيل مجموعة بيانات Unsplash

إنشاء فهرس وتحميل مصادف ميزة الصورة إلى Elasticsearch

بناء صورة Docker

تشغيل تطبيق STREMLIT

شكر وتقدير

كلمة البحث 800

Inf CLIP

كليب دلو

مضيف صورة CF

برنامج تغيير حجم الصور VSO

سوبر صورة البرنامج المساعد

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express