Загрузка Data processing augment vectorDB загрузка

Data processing augment vectorDB

Другой исходный код

1.0.0

Скачать

Проект модного продукта и поиск

Обзор проекта

Этот проект фокусируется на внедрении и извлечении крупномасштабного набора данных модного продукта, собранного у крупных брендов, таких как Aarong, Allen Solly, Bata, Apex и Infinity. Набор данных состоит из более чем 20 000 продуктов, охватывающих широкий спектр категорий и стилей. Записная книжка использует мощные модели и инструменты для создания встраиваний как для текста, так и для изображений, а затем хранит эти встраивания в векторной базе данных с использованием Qdrant. Эта настройка позволяет эффективно и точно извлекать модные продукты на основе семантического сходства.

Ключевые функции

Детали набора данных

Набор данных, размещенный на обнимательном лице, включает в себя более 20 000 модных продуктов, скрещенных из нескольких источников, с деталями, такими как категория продуктов, компания, название, описание, спецификации, ссылки на изображения и многое другое. Вы можете исследовать набор данных здесь.

Встраиваемые модели

Встроенные тексты: ноутбука использует модель text-embedding-3-large для создания высокоразмерных встраиваний для описаний и резюме продукта.
Внедрение изображений: Clip ( clip-ViT-B-32 ) из библиотеки SentenceTransformer используется для генерации встроенных изображений. Эта модель отражает визуальные особенности, которые можно использовать для поиска аналогичных продуктов на основе их внешнего вида.

Стратегия встраивания

Для каждого продукта генерируется сводная строка, снимая данные ключевых данных, такие как категория, компания, имя и спецификации. Эта строка затем встраивается с использованием текстовой модели. Одновременно, основное изображение продукта загружается, обрабатывается и кодируется для создания встраивания изображения. Оба встроения хранятся в коллекции Qdrant для эффективного поиска вектора.

Qdrant Vector Database

База данных Qdrant используется в качестве векторного хранилища для этих встроений, поддерживая поиск сходства в реальном времени, основанные как на запросах текста и изображения. Записная книжка создает коллекцию, в которой разместятся как резюме, так и векторы изображений с использованием сходства косинуса.

Масштабируемый трубопровод данных

Записная книжка итерация над набором данных и:

Генерирует уникальные идентификаторы документов.
Подготавливает краткие строки для встраивания текста.
Загрузки и обработки изображений продукта.
Вычисления встраивания как для текста, так и для изображений.
Хранят встроенные и связанные с ними метаданные (например, идентификатор продукта, ссылки и описания) в Qdrant.

Эта настройка обеспечивает бесшовную интеграцию в любую систему, требующую рекомендации модного продукта или функциональности поиска на основе мультимодальных данных.

Пример векторных точек Qdrant

На изображении выше демонстрируется количество векторных точек, хранящихся в коллекции Qdrant, визуализируя масштаб набора данных и хранимых встроенных встроений.

Инструкции по использованию

Клонировать репозиторий и установить необходимые зависимости.
Загрузите набор данных с обнимающегося лица.
Запустите ноутбук, чтобы начать встраивать и хранить модные продукты в Qdrant.

Проект является отличным ресурсом для тех, кто хочет изучить мультимодальные встроения, векторные базы данных и модные данные в масштабе.

Llava Description Generator

В этом проекте используется модель Llava (ассистент языка и видения) для создания описаний продуктов и спецификаций из изображений. Модель основана на разговорной архитектуре ИИ, которая может взаимодействовать как с текстовыми, так и с визуальными входами.

Начиная

Предварительные условия

Перед запуском кода убедитесь, что у вас установлены следующие зависимости:

Python 3.7+
Google Colab или локальная среда с поддержкой GPU
Библиотеки transformers и datasets обнимающего лица
torch для поддержки пирога
PIL для обработки изображений

Установка

Установите пакет Llava:

 ! pip install git+https://github.com/haotian-liu/LLaVA.git@786aa6a19ea10edc6f574ad2e16276974e9aaa3a

Установите дополнительные зависимости:
```
 ! pip install -qU datasets
```

Использование

Инициализируйте чат -бот Llava:

 from transformers import AutoTokenizer , BitsAndBytesConfig
from llava . model import LlavaLlamaForCausalLM
from llava . utils import disable_torch_init
from llava . constants import IMAGE_TOKEN_INDEX , DEFAULT_IMAGE_TOKEN , DEFAULT_IM_START_TOKEN , DEFAULT_IM_END_TOKEN
from llava . mm_utils import tokenizer_image_token , KeywordsStoppingCriteria
from llava . conversation import conv_templates , SeparatorStyle
import torch
from PIL import Image
import requests
from io import BytesIO

chatbot = LLaVAChatBot ( load_in_8bit = True ,
                       bnb_8bit_compute_dtype = torch . float16 ,
                       bnb_8bit_use_double_quant = True ,
                       bnb_8bit_quant_type = 'nf8' )

Загрузите набор данных:

 from datasets import load_dataset

fashion = load_dataset (
    "thegreyhound/demo2" ,
    split = "train"
)
product_df = fashion . to_pandas ()

Генерировать описания и спецификации продукта:

 cnt = 1
for index , row in product_df . iterrows ():
    str1 = "Given Image detail was: " + row [ 'Description' ] + " Now generate a brief high level description for the product shown in the image"
    str2 = "Given Image detail was: " + row [ 'Description' ] + " Now generate a detailed specifications for the product shown in the image including the fabric, color, design, style etc"
    
    ans1 = chatbot . start_new_chat ( img_path = row [ 'Image_link' ],
                                  prompt = str1 )
    ans2 = chatbot . start_new_chat ( img_path = row [ 'Image_link' ],
                                  prompt = str2 )
    
    product_df . loc [ index , 'Description' ] = ans1
    product_df . loc [ index , 'Specifications' ] = ans2
    
    print ( cnt )
    cnt += 1

Пример вывода

Сценарий обрабатывает изображения и генерирует описания продуктов высокого уровня и подробные спецификации. Окончательный вывод сохраняется в файле JSON, содержащем множество информации о продукте.

Лицензия

Этот проект лицензирован по лицензии MIT - для получения подробной информации см. Файл лицензии.

Благодарности

Llava Project

Автор

Назмус Сакиб.

Вы можете найти более подробную информацию и получить доступ к набору данных при обнимании.

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-05-30
размер 44.24KB
От Github

Связанные приложения

MMEarth data

2024-11-12
Contoso Data Generator V2

2024-11-11
EMIT Data Resources

2024-11-09
Experimental_data_processing

2024-11-02
Биологический анализ данных

2010-03-22
Умное восстановление данных

2009-06-18

Data processing augment vectorDB

Проект модного продукта и поиск

Обзор проекта

Ключевые функции

Детали набора данных

Встраиваемые модели

Стратегия встраивания

Qdrant Vector Database

Масштабируемый трубопровод данных

Пример векторных точек Qdrant

Инструкции по использованию

Llava Description Generator

Начиная

Предварительные условия

Установка

Использование

Пример вывода

Лицензия

Благодарности

Автор

MMEarth data

Contoso Data Generator V2

EMIT Data Resources

Experimental_data_processing

Биологический анализ данных

Умное восстановление данных

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express