nboost скачать - загрузка исходного кода nboost

nboost

Другой исходный код

1.0.0

Скачать

? Мы ищем бета -тестеры для нашего виртуального помощника. Свяжитесь с нами, если вы заинтересованы в использовании его на своем сайте.

Основные моменты • Обзор • Проценсы • Установка • Начало работы • Kubernetes • Документация • Учебные пособия • Внесение вклад • Заметки о выпуске • Блог

Что это такое

⚡ NBOOST -это масштабируемая платформа для поискового двигателя для разработки и развертывания самых современных моделей для улучшения актуальности результатов поиска.

NBOOST использует современные модели для производства нейронных поисковых систем, специфичных для домена. Платформа также может улучшить другие нисходящие задачи, требующие рангового ввода, таких как ответ на вопрос.

Свяжитесь с нами, чтобы запросить специфичные для домена модели или оставить отзыв

Обзор

Рабочий процесс NBOOST относительно прост. Возьмите графику выше и представьте, что сервер в этом случае является Elasticsearch.

В обычном запросе поиска пользователь отправляет запрос Elasticsearch и возвращает результаты.

В запросе поиска NBOOST пользователь отправляет запрос на модель . Затем модель запрашивает результаты Elasticsearch и выбирает лучшие, чтобы вернуться к пользователю.

Тесты

? Обратите внимание, что мы оцениваем модели на различных наборах, чем они были обучены (MS Marco vs Trec-Car), что предполагает обобщение этих моделей для многих других проблем поиска реального мира.

Тонкие модели	Оценка набор	Поиск повышения ^[1]	Скорость на графическом процессоре
`nboost/pt-tinybert-msmarco` ( по умолчанию )	Bing Запросы	+45% _{^{(0,26 против 0,18)}}	~ 50 мс/запрос
`nboost/pt-bert-base-uncased-msmarco`	Bing Запросы	+62% _{^{(0,29 против 0,18)}}	~ 300 мс/запрос
`nboost/pt-bert-large-msmarco`	Bing Запросы	+77% _{^{(0,32 против 0,18)}}	-
`nboost/pt-biobert-base-msmarco`	биом	+66% _{^{(0,17 против 0,10)}}	~ 300 мс/запрос

Инструкции для воспроизведения здесь.

_{[1] MRR по сравнению с BM25, по умолчанию для Elasticsearch. Повторный топ 50.}
_{[2] https://github.com/nyu-dl/dl4marco-bert}

Чтобы использовать одну из этих тонких моделей с NBOOST, запустите nboost --model_dir bert-base-uncased-msmarco например, он будет загружать и автоматически кеш.

Используя предварительно обученные модели «Понимание языка», вы можете повысить метрики релевантности поиска почти в 2 раза по сравнению с простой текстовой поиском, практически без дополнительной конфигурации. При оценке производительности часто существует компромисс между точностью и скоростью модели, поэтому мы сравниваем оба этих фактора выше. Эта таблица лидеров находится в стадии разработки, и мы намерены выпустить более передовые модели!

Установите NBOOST

Есть два способа получить NBOOST, либо в виде изображения Docker, либо как пакет PYPI. Для пользователей облаков мы настоятельно рекомендуем использовать NBOOST через Docker .

? В зависимости от вашей модели вы должны установить соответствующие зависимости Tensorflow или Pytorch. Мы упаковываем их ниже.

Для установки NBOOST следуйте таблице ниже.

Зависимость	? Докер	? Пипи	? Kubernetes
Pytorch ( рекомендуется )	_{^{koursaros/nboost:latest-pt}}	_{^{pip install nboost[pt]}}	_{^{helm install nboost/nboost --set image.tag=latest-pt}}
Tensorflow	_{^{koursaros/nboost:latest-tf}}	_{^{pip install nboost[tf]}}	_{^{helm install nboost/nboost --set image.tag=latest-tf}}
Все	_{^{koursaros/nboost:latest-all}}	_{^{pip install nboost[all]}}	_{^{helm install nboost/nboost --set image.tag=latest-all}}
- ( для тестирования )	_{^{koursaros/nboost:latest-alpine}}	_{^{pip install nboost}}	_{^{helm install nboost/nboost --set image.tag=latest-alpine}}

В любом случае, если вы его установите, если вы в конечном итоге читаете следующее сообщение после $ nboost --help или $ docker run koursaros/nboost --help , тогда вы готовы к работе!

Успешная установка NBOOST

Начиная

Прокси
Настройка нейронного прокси для Elasticsearch за 3 минуты
- Настройка сервера Elasticsearch
- Развертывание прокси
- Индексирование некоторых данных
Эластичная сделана легко

? Прокси

Прокси является ядром NBOOST. Прокси - это, по сути, обертка, позволяющая служить модели. Он может понять входящие сообщения из конкретных поисковых API (то есть Elasticsearch). Когда прокси получает сообщение, он увеличивает количество результатов, которые клиент просит, чтобы модель могла повлиять на больший набор и вернуть (надеюсь) лучшие результаты.

Например, если клиент просит 10 результатов, чтобы сделать запрос «коричневые собаки» от Elasticsearch, то прокси может увеличить запрос результатов до 100 и отфильтровать лучшие десять результатов для клиента.

Настройка нейронного прокси для Elasticsearch за 3 минуты

В этом примере мы создадим прокси, чтобы сидеть между клиентом и Elasticsearch и повысить результаты!

Установка NBOOST с TensorFlow

Если вы хотите запустить пример на GPU, убедитесь, что у вас есть Tensorflow 1.14-1.15, Pytorch или Onnx Stime с CUDA для поддержки функциональности моделирования. Однако, если вы хотите просто запустить его на процессоре, не беспокойтесь об этом. Для обоих случаев просто беги:

pip install nboost[pt]

Настройка сервера Elasticsearch

? Если у вас уже есть сервер Elasticsearch, вы можете пропустить этот шаг!

Если у вас нет Elasticsearch, не волнуйтесь! Мы рекомендуем настроить локальный кластер Elasticsearch с использованием Docker (при условии установки Docker). Во -первых, получите изображение ES, работая:

docker pull elasticsearch:7.4.2

После того, как у вас есть изображение, вы можете запустить сервер Elasticsearch через:

docker run -d -p 9200:9200 -p 9300:9300 -e " discovery.type=single-node " elasticsearch:7.4.2

Развертывание прокси

Теперь мы готовы развернуть нашу нейронную прокси! Это очень просто сделать, беги:

nboost                                  
    --uhost localhost                   
    --uport 9200                        
    --search_route " /<index>/_search "   
    --query_path url.query.q            
    --topk_path url.query.size          
    --default_topk 10                   
    --choices_path body.hits.hits       
    --cvalues_path _source.passage

? --uhost и --uport должны быть такими же, как на сервере Elasticsearch выше! Uhost и Uport не имеют достопримечательностей для Upstream-Host и Upstream-Port (имея в виду восходящий сервер).

Если вы получите это сообщение: Listening: <host>:<port> , тогда мы готовы идти!

Индексирование некоторых данных

NBOOST имеет удобный инструмент индексации встроенный ( nboost-index ). Для демонстрационных целей будет индексировать набор отрывков о путешествиях и отелях через NBOOST. Вы можете добавить индекс на свой сервер Elasticsearch, работая:

travel.csv поставляется с nboost

nboost-index --file travel.csv --index_name travel --delim , --id_col

Теперь давайте протестируем это! Нажмите на Elasticsearch с:

curl " http://localhost:8000/travel/_search?pretty&q=passage:vegas&size=2 "

Если в результате Elasticsearch есть тег nboost , поздравляю, он работает!

Успешная установка NBOOST

Что только что случилось?

Давайте посмотрим на фронт NBOOST . Зайдите в свой браузер и посетите Localhost: 8000/nboost.

Если у вас нет доступа к браузеру, вы можете curl http://localhost:8000/nboost/status для той же информации.

Фронт записал все, что произошло:

NBOOST получил запрос на 2 результата поиска . (средний_topk)
NBOOST подключен к серверу на localhost:9200 .
NBOOST отправил запрос на 50 результатов поиска на сервер. (топн)
NBOOST получил 50 результатов поиска с сервера. (Средний_чоис)
Модель выбрала лучшие результаты поиска 2 и вернула их клиенту.

Эластичная сделана легко

Чтобы увеличить количество параллельных прокси, просто увеличьте --workers . Для более надежного подхода к развертыванию вы можете распространять прокси через Kubernetes (см. Ниже).

Kubernetes

Смотрите также

Для углубленного запроса DSL и других поисковых решений API (таких как Bing API) см. Документы.

Развертывание NBOOST через Kubernetes

Мы можем легко развернуть NBOOST в кластере Kubernetes, используя Helm.

Добавить nboost helm Repo

Сначала нам нужно зарегистрировать репо с вашим кластером Kubernetes.

helm repo add nboost https://raw.githubusercontent.com/koursaros-ai/nboost/master/charts/
helm repo update

Развернуть некоторые реплики NBOOST

Попробуем развернуть четыре реплики:

helm install --name nboost --set replicaCount=4 nboost/nboost

Все возможные параметры --set (values.yaml) перечислены ниже:

Параметр	Описание	По умолчанию
`replicaCount`	Количество реплик для развертывания	`3`
`image.repository`	NBOOST ИЗОБРАЖЕНИЕ ИЗОБРАЖЕНИЕ	`koursaros/nboost`
`image.tag`	NBOOST Image Tag	`latest-pt`
`args.model`	Название модельного класса	`nil`
`args.model_dir`	Название или каталог современной модели	`pt-bert-base-uncased-msmarco`
`args.qa`	Использовать плагин QA	`False`
`args.qa_model_dir`	Название или каталог модели QA	`distilbert-base-uncased-distilled-squad`
`args.model`	Название модельного класса	`nil`
`args.host`	Хост -имени прокси -сервера	`0.0.0.0`
`args.port`	Порт для прокси для прослушивания	`8000`
`args.uhost`	Имя хоста сервера API поиска вверх по течению	`elasticsearch-master`
`args.uport`	Порт вверх по течению	`9200`
`args.data_dir`	Каталог для кэша модели двоичный файл	`nil`
`args.max_seq_len`	Макс комбинированная длина токена	`64`
`args.bufsize`	Размер HTTP -буфера в байтах	`2048`
`args.batch_size`	Размер партии для пробега через модель Rerank	`4`
`args.multiplier`	Фактор, чтобы увеличить результаты	`5`
`args.workers`	Количество потоков, обслуживающих прокси	`10`
`args.query_path`	Jsonpath в просьбе найти запрос	`nil`
`args.topk_path`	Jsonpath, чтобы найти количество запрошенных результатов	`nil`
`args.choices_path`	Jsonpath, чтобы найти множество вариантов для повторного порядок	`nil`
`args.cvalues_path`	Jsonpath, чтобы найти значения STR выбора	`nil`
`args.cids_path`	Jsonpath, чтобы найти идентификаторы выбора	`nil`
`args.search_path`	Путь URL -адреса для повторения через NBOOST	`nil`
`service.type`	Kubernetes Service Type	`LoadBalancer`
`resources`	Потребности и ограничения ресурсов для применения к стручке	`{}`
`nodeSelector`	Метки узлов для назначения стручков	`{}`
`affinity`	Настройки сродства для назначения стручков	`{}`
`tolerations`	Toperator Labels для назначения стручков	`[]`
`image.pullPolicy`	Политика привлечения изображений	`IfNotPresent`
`imagePullSecrets`	Docker Registry Secret имена как массив	`[]` (не добавляют секреты притяжения изображения в развернутые стручки)
`nameOverride`	Строка для переопределения chart.name	`nil`
`fullnameOverride`	Строка для переопределения chart.fullName	`nil`
`serviceAccount.create`	Указывает, создается ли учетная запись сервиса	`nil`
`serviceAccount.name`	Название учетной записи службы для использования. Если не установить и создать, верно, имя генерируется с использованием шаблона FullName	`nil`
`serviceAccount.create`	Указывает, создается ли учетная запись сервиса	`nil`
`podSecurityContext.fsGroup`	Идентификатор группы для контейнера	`nil`
`securityContext.runAsUser`	Идентификатор пользователя для контейнера	`1001`
`ingress.enabled`	Включить ресурс Ingress	`false`
`ingress.hostName`	Имя хоста для вашей установки	`nil`
`ingress.path`	Путь внутри структуры URL	`[]`
`ingress.tls`	Включить вход с TLS	`[]`
`ingress.tls.secretName`	Секрет типа TLS, который будет использован	`chart-example-tls`

Документация

Официальная документация NBOOST размещена на nboost.readthedocs.io. Он автоматически создан, обновляется и архивируется на каждом новом выпуске.

Внося

Вклады высоко ценятся! Вы можете внести исправления или обновления и совершить их в NBOOST. Вот шаги:

Создайте новую филиал, скажем, fix-nboost-typo-1
Исправить/улучшить кодовую базу
Совершить изменения. Примечание. Сообщение о коммите должно следовать стилю именования , скажем Fix/model-bert: improve the readability and move sections
Сделайте запрос на тягу. Обратите внимание, что запрос на вытягивание должен следовать стилю именования . Это может быть просто одно из ваших сообщений о коммите, просто скопируйте вставьте его, например, Fix/model-bert: improve the readability and move sections
Отправьте запрос на привлечение и дождитесь прохождения всех чеков (обычно 10 минут)
- Стиль кодирования
- Проверка стилей коммита и пиара
- Все модульные тесты
Запросите обзоры от одного из разработчиков из нашей основной команды.
Мержась!

Более подробную информацию можно найти в руководящих принципах участника.

Ссылаясь на NBOOST

Если вы используете NBOOST в академической статье, мы хотели бы, чтобы вас цитировали. Вот два способа ссылки на NBOOST:

 footnote{https://github.com/koursaros-ai/nboost}

@misc{koursaros2019NBoost,
  title={NBoost: Neural Boosting Search Results},
  author={Thienes, Cole and Pertschuk, Jack},
  howpublished={ url {https://github.com/koursaros-ai/nboost}},
  year={2019}
}

Лицензия

Если вы загрузили копию двоичного или исходного кода NBOOST, обратите внимание, что двоичный и исходный код NBOOST и исходный код лицензированы по лицензии Apache, версия 2.0.

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-03-10
размер 2.69MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

nboost

Что это такое

Обзор

Тесты

Установите NBOOST

Начиная

? Прокси

Настройка нейронного прокси для Elasticsearch за 3 минуты

Установка NBOOST с TensorFlow

Настройка сервера Elasticsearch

Развертывание прокси

Индексирование некоторых данных

Что только что случилось?

Эластичная сделана легко

Kubernetes

Смотрите также

Развертывание NBOOST через Kubernetes

Добавить nboost helm Repo

Развернуть некоторые реплики NBOOST

Документация

Внося

Ссылаясь на NBOOST

Лицензия

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express