Потрясающий семантический поиск
Логотип, сделанный @createdbytango.
Ищу больше бумажных дополнений. PS: Поднимите пиар
Следуя репозитории направлено на то, чтобы служить мета-повторному репозиции для семантических задач, связанных с сходством.
Семантический поиск не ограничен текстом! Это можно сделать с помощью изображений, речи и т. Д.
Не стесняйтесь поднять пиар на этом репо!
Содержимое
- Документы
- 2014
- 2015
- 2016
- 2017
- 2018
- 2019
- 2020
- 2021
- 2022
- 2023
- Статьи
- Библиотеки и инструменты
- Наборы данных
- Вехи
Документы
2010 год
- Приоритетные деревья
- Поиск информации и семантическая паутина?
2014
- Скрытая семантическая модель со структурой сверточной деятельности для поиска информации?
2015
- Пропустить векторы?
- Практический и оптимальный LSH для углового расстояния
2016
- Мешок трюков для эффективной классификации текста?
- Обогащение векторов слов с помощью информации о подвесках?
- Эффективный и надежный приблизительный поиск ближайшего соседа с использованием иерархических судоходных графиков маленького мира
- Приблизительно в поисках аналогичных вторжений слов
- Обучение Распределенным представлениям предложений из некабельных данных?
- Приблизительный поиск ближайшего соседа по данным высокого размера --- Эксперименты, анализы и улучшение
2017
- Наблюдение за изучением универсальных представлений о предложении из данных о выводе естественного языка?
- Семантическое текстовое сходство для хинди?
- Эффективное предложение реагирования на естественный язык для умного ответа?
2018
- Универсальный предложенный кодер?
- Обучение семантического текстового сходства от разговоров?
- Блог Google AI: достижения в семантическом текстовом сходстве?
- Речь2VEC: структура последовательности к последовательности для изучения встроенных слов из речи)?
- Оптимизация индексации на основе k-nearest соседнего графика для поиска близости в высокомерных данных?
- Быстрый приблизительный поиск ближайшего соседа с графиком навигационного распределения
- Случай для обученных индексных структур
2019
- Лазер: Языковые агностические представления предложения?
- Расширение документов с помощью прогнозирования запросов?
- Приговор-Берт: встраивание предложения с использованием сиамского Bert-Networks?
- Многостадовый рейтинг документов с Бертом?
- Скрытый поиск для слабопринятых вопросов с открытым доменом.
- Сквозные вопросы с открытым доменом, отвечающий с помощью Bertserini
- Biobert: предварительно обученная модель представления биомедицинского языка для майнинга биомедицинского текста?
- Анализ и улучшение представлений с мягкой потерей ближайшего соседа?
- Diskann: Быстрый точный миллиард точек ближайшего соседа поиск на одном узле
2020
- Быстро развертывание нейронной поисковой системы для открытого набора данных COVID-19: предварительные мысли и извлеченные уроки?
- Переезд с Бертом?
- Совместный поиск: поиск информации Covid-19 с помощью семантического поиска, ответа на вопросы и абстрактной суммирования?
- Labse: Языко-агрессивный берт-предложение внедрение?
- Covidex: модели нейронного ранжирования и инфраструктура поиска ключевых слов для открытого набора данных COVID-19?
- Detext: глубокая структура NLP для интеллектуального понимания текста?
- Создание монолингальных предложений встраивалось многоязычным, используя дистилляцию знаний?
- Предварительные трансформаторы для рейтинга текста: Берт и за его пределами?
- Царство: до тренировки языковой модели поиска-августа.
- Electra: предварительно тренировочные текстовые кодеры как дискриминаторы, а не генераторы?
- Улучшение глубокого обучения для поиска Airbnb
- Управление разнообразием в поиске Airbnb?
- Приблизительное ближайшее соседское негативное контрастное обучение для плотного извлечения текста?
- Неконтролируемые вторжения в стиль изображения для задач поиска и распознавания?
- DECLUTR: Глубокое контрастное обучение для неконтролируемых текстовых представлений?
2021
- Гибридный подход для расчета семантического сходства между тамильскими словами?
- Дополненный Сберт?
- BEIR: Гетерогенный эталон для нулевой оценки моделей поиска информации?
- Совместимость с гетерогенным визуальным поиском?
- Изучение личного стиля из нескольких примеров?
- TSDAE: Использование последовательного авоат-экодерка на основе трансформатора для неконтролируемого предложения внедряет обучение?
- Обзор трансформаторов ??
- SPLADE: Sparse Lexical и Expansion Model для первого этапа рейтинга?
- Высококачественные предложения поискового запроса с использованием обучения глубоким подкреплением
- Поиск продукта на основе встраивания в поисках Taobao ??
- TPRM: Индивидуальная модель рейтинга, основанная на темах для веб-поиска?
- MMARCO: многоязычная версия набора данных MS Marco Passing?
- Рассуждение о базе данных по тексту?
- Как состязательный точный настройка выгода Берт?)?
- Тренируйся короткий, тест Длинный: Внимание с линейными смещениями позволяет экстраполяция входной длины?
- Праймер: Ищете эффективные трансформаторы для языкового моделирования?
- Насколько знакомо это звучит? Анализ межсового репрезентативного сходства акустических встроений слов?
- Simcse: простое контрастное обучение встроенных предложений?
- Уделение композиции: рассеяние поиска и поиска ??
- Спанн: высокоэффективный примерный в миллиардном поиске ближайшего соседа
- GPL: Генеративная псевдо маркировка для неконтролируемой доменной адаптации плотного поиска?
- Генеративные поисковые системы: начальные эксперименты?
- Переосмысление поиска: делая эксперты по домену из дилетантеса -Whiteningbert: легкий подход встраивания без присмотра.
2022
- Текст и кодовые встроены на контрастной предварительной тренировке?
- RELIC: Получение доказательств для литературных претензий?
- Trans-Encoder: неконтролируемое моделирование предложений с помощью самостоятельных и взаимных дистанций?
- SAMU-XLSR: Семантически выравнивано многомодальное речевое представление на уровне высказывания?
- Анализ функций слияния для гибридного поиска?
- Обнаружение за пределами распределения с глубокими ближайшими соседями
- ESB: эталон для многодоменного сквозного распознавания речи?
- Анализ акустических слов встраивания из предварительно обученных самоотверженных речевых моделей)?
- Переосмысление с поиском: верный вывод о большой языке?
- Точный нулевой плотный поиск без релевантных ярлыков?
- Память трансформатора как индекс дифференцируемого поиска?
2023
- Finger: Быстрый вывод для приблизительного поиска ближайшего соседа на основе графика?
- Текстовая классификация «с низким ресурсом»: метод классификации без параметров с компрессорами?
- SPARSEEMBED: изучение редких лексических представлений с контекстуальными встроками для поиска?
Статьи
- Борьба с семантическим поиском
- Семантический поиск в когнитивном поиске Azure
- Как мы использовали семантический поиск, чтобы сделать наш поиск в 10x умнее
- Стэнфордский блог AI: создание масштабируемого, объяснимого и адаптивного NLP -моделей с помощью поиска
- Создание семантической поисковой системы с двойным космическим словом
- Поиск семантического сходства в миллиардах с Faiss+Sbert
- Некоторые наблюдения о порогах поиска сходства
- Почти дубликатный поиск изображений с использованием чувствительного к местному хешированию
- Бесплатный курс по поиску сходства вектора и Faiss
- Комплексное руководство по приближным алгоритмам ближайших соседей
- Представление гибридного индекса для включения семантического поиска с ключевыми словами.
- Аргилла семантический поиск
- CO: Вот многоязычная модель понимания текста
- Упростить поиск многоязычных моделей встраивания
Библиотеки и инструменты
- Фасттекст
- Универсальный предложенный кодер
- Сберт
- Электра
- Лабсе
- Лазер
- Актуальность AI - векторная платформа от экспериментов до развертывания
- Сетей
- Jina.ai
- Pinecone
- Senteval Toolkit
- Ранкс
- BEIR: Cenderking IR
- Реликвия: получение доказательств для набора данных литературных претензий
- Matchzoo-Py
- Deep_Text_Matching
- Какой кадр?
- Lexica.art
- Семантический поиск эмодзи
- Пирорини
- Бертсерини
- Бертсимилар
- Милвус
- NeuroNlp ++
- укоренившись
- Семантические поиски проводятся в Википедию-Виавит
- естественный языко-Youtube-Search
- то же самое. Энергетика
- Энн Бенчмамы
- скана
- ОБЛАСТЬ
- раздражать
- Pynndescent
- гнездо
- Сокол
- Redis Hnsw
- AutoFaiss
- Дпр
- rank_bm25
- Flashrank
- близок
- vearch
- Веспа
- Pynndescent
- Пганн
- Сходство тензорфлоу
- opensemanticsearch.org
- GPT3 Semantic Search
- Поиск
- txtai
- Гипертог
- вектор
- EnceddingHub
- Aquiladb
- Стрипнет
Наборы данных
- Семантический текстовый концентратор сходства текста
- Facebook AI AI -Challenge Challenge
- Остроумие: набор данных текста изображения на основе Википедии
- Бреть
- Mteb
Вехи
Посмотрите на состав проекта для списка задач, чтобы внести свой вклад в любую из открытых вопросов.