Tolle semantische Suche
Logo gemacht von @CreatedBytango.
Auf der Suche nach weiteren Papierzusagen. PS: Erhöhen Sie eine PR
Das Repository zielt darauf ab, ein Meta-Repository für semantische Suche und semantische Ähnlichkeitsaufgaben zu dienen.
Die semantische Suche ist nicht auf Text beschränkt! Es kann mit Bildern, Sprache usw. durchgeführt werden.
Fühlen Sie sich frei, eine PR auf diesem Repo zu erhöhen!
Inhalt
- Papiere
- 2014
- 2015
- 2016
- 2017
- 2018
- 2019
- 2020
- 2021
- 2022
- 2023
- Artikel
- Bibliotheken und Werkzeuge
- Datensätze
- Meilensteine
Papiere
2010
- Prioritätsbereiche Bäume
- Informationsabruf und das semantische Web?
2014
- Ein latentes semantisches Modell mit Faltungs-Pooling-Struktur zum Abrufen von Informationen?
2015
- Vektoren überspringen?
- Praktische und optimale LSH für Winkelabstand
2016
- Trickbeutel für eine effiziente Textklassifizierung?
- Anreicherung von Wortvektoren mit Subwordinformationen?
- Effiziente und robuste ungefähre Suche nach der nächsten Nachbarn mit hierarchischen schiffbaren kleinen Weltgrafiken
- Bei der ungefähr nach ähnlichen Worteinbettungen suchen
- Lernen verteilte Darstellungen von Sätzen aus unbeschriebenen Daten?
- Ungefähre Nachbarsuchung der nächsten Nachbarn bei hohen dimensionalen Daten-Experimente, Analysen und Verbesserung
2017
- Übersichtliches Lernen von universellen Satzdarstellungen aus natürlichen Sprachinferenzdaten?
- Semantische textliche Ähnlichkeit für Hindi?
- Effizienter Vorschlag für die natürliche Sprache für die intelligente Antwort?
2018
- Universeller Satz Encoder?
- Semantische textuelle Ähnlichkeit aus Gesprächen lernen?
- Google AI Blog: Fortschritte in der semantischen textuellen Ähnlichkeit?
- Sprache2VEC: Ein Sequenz-zu-Sequenz-Framework zum Lernen von Worteinbettungen aus der Sprache)?
- Optimierung der Indexierung basierend auf K-Nearest Neighbor Graph für die Proximity-Suche in hochdimensionalen Daten?
- Schnelle ungefähre Suche nach Nachbarn mit dem Navigating-Ausbreitungsdiagramm
- Der Fall für erlernte Indexstrukturen
2019
- Laser: Sprache Agnostische Satz Darstellungen?
- Dokumentausweiterung durch Abfragevorhersage?
- Satzbert: Satzeinbettungen mit siamesischen Bert-Networks?
- Multi-Stufe-Dokumentranking mit Bert?
- Latentes Abrufen für schwach beaufsichtigte offene Domain -Frage -Beantwortung
- End-to-End-Fragen zur Beantwortung von Bertserini
- Biobert: Ein vorgebildetes Modell für biomedizinische Sprachdarstellungen für den biomedizinischen Textabbau?
- Analyse und Verbesserung von Darstellungen mit dem Verlust des weichen nächsten Nachbarn?
- Diskann: Schnell genaue Milliardenpunkt-Nachbarsuchung auf einem einzelnen Knoten
2020
- Schnell eine neuronale Suchmaschine für den Covid-19 Open Research-Datensatz einsetzen: vorläufige Gedanken und Lektionen, die gezogen werden?
- Passage erneut mit Bert?
- Co-Suche: COVID-19-Informationen Abrufen mit semantischer Suche, Fragenbeantwortung und abstrakter Zusammenfassung?
- Labse: Sprach-Agnostische Bert-Satzeinbettung?
- Covidex: Neuronale Ranking-Modelle und Keyword-Suchinfrastruktur für den CoVID-19 Open Research Dataset?
- Dettext: Ein tiefes NLP -Framework für intelligentes Textverständnis?
- Monolingual -Satz -Einbettungen mehrsprachig mit Wissensdestillation machen?
- Vorbereitete Transformatoren für Textranking: Bert und Beyond?
- Realm: Abrufen-Sprachmodell vor dem Training
- Electra: Textcodierer vor dem Training eher als Diskriminatoren als als Generatoren?
- Verbesserung des Deep -Lernens für die Airbnb -Suche
- Vielfalt bei der Airbnb -Suche verwalten?
- Ungefähr dem nächsten Nachbarn Negatives kontrastives Lernen für dichte Textabnahme?
- Unbeaufsichtigtes Bildstil Einbettungen für Abruf- und Erkennungsaufgaben?
- DECDUTR: Tiefes kontrastives Lernen für unbeaufsichtigte Textdarstellungen?
2021
- Hybridansatz für die semantische Ähnlichkeitsberechnung zwischen tamilischen Wörtern?
- Augmented Sbert?
- Beir: Ein heterogener Benchmark für die Bewertung von Null-Shot-Bewertung von Informationsabrufmodellen?
- Kompatibilitätsbewusste heterogene visuelle Suche?
- Persönlichen Stil aus wenigen Beispielen lernen?
- TSDAE: Verwenden von transformatorbasiertem sequentiellem Denoising-Auto-Ccoder für unbeaufsichtigtes Satz, das Lernen einbettet?
- Eine Umfrage unter Transformatoren?
- Splade: Spärliches lexikalisches und Expansionsmodell für das Ranking der ersten Stufe?
- Hochwertig verwandte Suchanfragen Vorschläge mit tiefem Verstärkungslernen
- Einbettungsbasiertes Produktabruf in die Taobao-Suche?
- TPRM: Ein themenbasiertes personalisiertes Ranking-Modell für die Websuche?
- MMARCO: Eine mehrsprachige Version des MS Marco Passage -Ranking -Datensatzes?
- Datenbank -Argumentation über Text?
- Wie kommt Bert der Gegner der Feinabstimmung zugute?)?
- Zug kurz, testen Sie lange: Aufmerksamkeit mit linearen Verzerrungen ermöglicht die Extrapolation der Eingangslänge?
- Grundierung: Suche nach effizienten Transformatoren für die Sprachmodellierung?
- Wie vertraut klingt das? Kreuzsprachige repräsentative Ähnlichkeitsanalyse von akustischen Worteinbettungen?
- SIMCSE: Einfach kontrastives Lernen von Satzeinbettungen?
- Aufmerksamkeit der Komposition: Entwirrung von Suche und Abrufen?
- SPANN: Hocheffizientes Milliarden-Maßstab ungefähr nächster Nachbarsuchung
- GPL: Generative Pseudo -Kennzeichnung für unbeaufsichtigte Domänenanpassung des dichten Abrufs?
- Generative Suchmaschinen: Erste Experimente?
- Suche nachdenken: Domänenexperten aus Dilettanten -Whiteningbert: Ein einfacher unbeaufsichtigter Satz Einbettungsansatz
2022
- Text- und Code-Einbettungen durch kontrastive Vorausbildung?
- Relikt: Beweise für literarische Ansprüche abrufen?
- Transcoder: unbeaufsichtigte Modellierung von Satzpaaren durch Selbst- und gegenseitige Distillationen?
- SAMU-XLSR: Semantisch ausgerichtete multimodale Äußerungsebenekreuzungsdarstellung?
- Eine Analyse von Fusionsfunktionen für das Hybrid -Abruf?
- Erkennung außerhalb der Verteilung mit tiefen nächsten Nachbarn
- ESB: Ein Benchmark für Multi-Domänen-End-to-End-Spracherkennung?
- Analysieren von akustischen Wortbetten aus vorgebliebenen, selbstbewerteten Sprachmodellen)?
- Überdenken mit Abruf: Gläubiges Großsprachenmodellinferenz?
- Präzise null-schotende dichte Wiederholung ohne Relevanzbezeichnungen?
- Transformatorspeicher als differenzierbarer Suchindex?
2023
- Finger: schnelle Inferenz für die graphbasierte ungefähre Suche nach nächster Nachbarn?
- Textklassifizierung mit niedriger Ressourcen: Eine parameterfreie Klassifizierungsmethode mit Kompressoren?
- Spärdebed: Lernen spärliche lexikalische Darstellungen mit kontextuellen Einbettungen zum Abrufen?
Artikel
- Semantische Suche angehen
- Semantische Suche in der azurblauen kognitiven Suche
- Wie wir semantische Suche verwendet haben, um unsere Suche 10x intelligenter zu machen
- Stanford AI Blog: Erstellen skalierbarer, erklärbarer und adaptiver NLP -Modelle mit Abruf
- Erstellen einer semantischen Suchmaschine mit doppeltem Raum Wort Einbettungen
- Die semantische Ähnlichkeitssuche im Bereich Milliarden mit Faiss+Sbert
- Einige Beobachtungen zu Ähnlichkeitssuchschwellenwerten
- Nahe doppelte Bildsuche mit lokalempfindlichem Hashing
- Kostenloser Kurs zur Vektor -Ähnlichkeitssuche und Faiss
- Umfassender Leitfaden für die ungefähren Algorithmen der nächsten Nachbarn
- Einführung des Hybridindex, um die semantische Suche nach keywordsbewusstem semantischen Suchen zu aktivieren
- Argilla Semantische Suche
- CO: Hier ist mehrsprachiges Textverständnismodell
- Vereinfachen Sie die Suche mit mehrsprachigen Einbettungsmodellen
Bibliotheken und Werkzeuge
- FastText
- Universeller Satz Encoder
- Sbert
- Elektra
- Labor
- LASER
- Relevanz -AI -Vektorplattform vom Experimentieren bis zur Bereitstellung
- Heuhaufen
- Jina.ai
- Tannenzapfen
- Sental -Toolkit
- Ranx
- Beir.: Benchmarking IR
- Relikt: Beweise für literarische Schadensdatensatz abrufen
- Matchzoo-Py
- Deep_text_matching
- Welcher Rahmen?
- Lexica.Art
- Emoji Semantic Search
- Pyserini
- Bertserini
- Bertsimailarity
- Milvus
- Neuronlp ++
- Waviate
- Semantische Such-Through-Wikipedia-With-Wasing
- Natürliche Sprache-Youtube-Suche
- gleich.Emergie
- Ann Benchmarks
- Scann
- REICH
- belästigen
- Pynndescent
- NSG
- Falconn
- Redis Hnsw
- Autofaiss
- DPR
- RANK_BM25
- Flashrank
- Nearpy
- Varch
- Vespa
- Pynndescent
- Pann
- Tensorflow -Ähnlichkeit
- OpenSemanticsarch.org
- GPT3 Semantische Suche
- Suche
- txtai
- Hypertag
- Vectorai
- Einbettung
- Aquiladb
- Stripnet
Datensätze
- Semantische Textähnlichkeitsdatensatz -Hub
- Facebook AI Image Ähnlichkeit Herausforderung
- WIT: Wikipedia-basierter Bildtextdatensatz
- Beirr
- Mteb
Meilensteine
Schauen Sie sich das Projektboard für die Aufgabenliste an, um zu den offenen Problemen beizutragen.