Konversationsmodelle konnten in der Lage sein, auf das Web zugreifen oder ihre Behauptungen mit Quellen (AKA Attribution) sichern. Diese Chatbots sind daher wohl Informationsabrufmaschinen, die gegen traditionelle Suchmaschinen konkurrieren oder sogar ersetzen. Wir möchten diesen Modellen einen Raum widmen, aber auch dem allgemeineren Bereich des generativen Informationsabrufs. Wir abwenden das Feld vorläufig in zwei Hauptthemen: geerdete Antwortgenerierung und generatives Dokumentenabruf . Wir enthalten auch generative Empfehlungen, generative fundierte Zusammenfassung usw.
Pull-Requests Willkommen!
Deterministisches Zitieren: LLMs für die Gesundheitsversorgung sicherer machen
Matt Yeung
Personal Blog - Apr 2024 [Link]
Abrufener Augmented Generation Research: 2017-2024
Moritz Mallawitsch
Skalierungswissen - Februar 2024 [Link]
Mastering Lag: Wie man ein Enterprise Rag -System architektiert
Pratik Bhavsar
Galileo Labs - Jan 2024 [Link]
Rennen Mixtral 8x7 lokal mit llamaindex
Llamaindex
Llamaindex Blog - Dezember 2023 [Link]
Fortgeschrittene RAG -Techniken: Eine illustrierte Übersicht
Ivan Ilin
In Richtung AI - Dez. 2023 [Link]
Multimodale Lappenpipeline mit Llamaindex und NEO4J
Tomaz Bratanic
Llamaindex Blog - Dezember 2023 [Link]
Benchmarking Lappen auf Tischen
Langchain
Langchain Blog - Dezember 2023 [Link]
Advanced Rag 01: kleines bis zum Bigal Abruf
Sophia Yang
In Richtung Data Science - Nov 2023 [Link]
Abfrage -Transformationen
Langchain
Langchain Blog - Okt 2023 [Link]
Was macht einen Dialogvertreter nützlich?
Nazneen Rajani, Nathan Lambert, Victor Sanh, Thomas Wolf
Umarmung Face Blog - Jan 2023 [Link]
Prognose potenzieller Missverbrauch von Sprachmodellen für Desinformationskampagnen und die Verringerung des Risikos
Josh A. Goldstein, Girish Sastry, Micah Musser, Renée Diresta, Matthew Gentzel, Katerina Sedova
OpenAI -Blog - Jan 2023 [Link]
Fact, Fetch, And Reason: A Unified Evaluation Of Retrieval-Augmented Generation Satyapriya Krishna, Kalpesh Krishna, Anhad Mohananey, Steven Schwarcz, Adam Stambler, Shyam Upadhyay, Manaal Faruqui arXiv – Sep 2024 [paper] [data]
LitSearch: Ein Abruf -Benchmark für die Suche nach wissenschaftlicher Literatur
Anirudh Ajith, Mengzhou Xia, Alexis Chevalier, Tanya Goyal, Danqi Chen, Tianyu Gao
ARXIV - Juli 2023 [Papier] [Daten]
Hell: Ein realistischer und herausfordernder Benchmark für argumentationsintensive Abruf
Hongjin Su, Howard Yen, Mengzhou Xia, Weijia Shi, Niklas Muennighoff, Han-yu Wang, Haisu Liu, Quan Shi, Zachary S. Siegel, Michael Tang, Ruoxi Sun, Jinsung Yoon, sercan O. arik, Danqi Chen, Tao Yu Yu
ARXIV - OCT 2023 [Papier] [Daten] [Code]
Freshllms: Erfrischende große Sprachmodelle mit Suchmaschinenvergrößerung
Tu Vu, Mohit Iyyer, Xuezhi Wang, Noah Constant, Jerry Wei, Jason Wei, Chris Tar, Yun-Hsuan Sung, Denny Zhou, Quoc Le, Thang Luong
ARXIV - OCT 2023 [Papier] [Code]
LegalBench: Ein gemeinsam gebautes Benchmark für die Messung der rechtlichen Argumentation in Großsprachenmodellen
Neel Guha, Julian Nyarko, Daniel E. Ho, Christopher Ré, Adam Chilton, Aditya Narayana, Alex Chohlas-Wood, Austin Peters, Brandon Waldon, Daniel N. Rockmore, Diego Zambrano, Dmitry Talisman, Enam Hoque, Faiz Surani, Frank Fagan, Galit Sarfaty, Gregory M. Dickinson, Haggai Porat, Jason Hegland, Jessica Wu, Joe Nudell, Joel Niklaus, John Nay, Jonathan H. Choi, Kevin Tobia, Margaret Hagan, Megan Ma, Michael Livermore, Nikon Rasumov-Rahe, Nils Holzenberger, Noam Kolt, Peter Henderson, Sean Rehaag, Sharad Goel, Shang Gao, Spencer Williams, Sunny Gandhi, Tom Zur, Varun Iyer, Zehua Li
ARXIV - Aug 2023 [Papier] [Datensatz]
OpenSectionant Conversations - Demokratisierung der Ausrichtung des großsprachigen Modells
Andreas Köpf, Yannic Kilcher, Dimitri von Rütte, Sotiris Anagnostidis, Zhi-Rui Tam, Keith Stevens, Abdullah Barhoum, Nguyen Minh Duc, Oliver Stanley, Richárd Nagyfi, Shahuls, Shahuls, und gleicher MAGYULR, ARNAV DAHULUR, ARNAVR, UND SUBER SUBER SUBER SUBER SUBER SURI, ARNAV DAHULR, ARNAVE, ARNAVR, UND SUBER SUBER SUBER SURI, ARNAV DAHULR, ARNAVE, ARNAVE, UND SUBER SUBER SURI, UNTER Christoph schuhmann, Huu Nguyen, Alexander Mattick
Arxiv - April 2023 [Papier]
CHATGPT-RETRIEVALQA
Arian Askari, Mohammad Aliannejadi, Evangelos Kanoulas, Suzan Verberne
GitHub - Februar 2023 [Code]
Kamel: Wissensanalyse mit Multitken -Entitäten in Sprachmodellen
Jan-Christoph Kalo, Leandra Fichtel
AKBC 22 - [Papier]
Truthfulqa: Messen, wie Modelle menschliche Falschheit nachahmen
Stephanie Lin, Jacob Hilton, Owain Evans
ARXIV - Sep 2021 [Papier] [Code]
Komplexe Antwortabnahme
Laura Dietz, Manisha Verma, Filip Radlinski, Nick Craswell, Ben Gamari, Jeff Dalton, John Foley
TREC-2017-2019 [Link]
Graphgrag
Jonathan Larson, Steven Truitt
Microsoft - Februar 2024 [Code]
Verengung der Wissensbewertungslücke
Gal Yona, Roee Aharoni, Mor Geva
Arxiv - Jan 2024 [Papier]
DHS LLM Workshop - Modul 6
Sourab Mangrulkar
GitHub - Dez. 2023 [Code]
Primeqa: Das Hauptrepository für hochmoderne mehrsprachige Frage zur Beantwortung von Forschung und Entwicklung
Avirup Sil, Jaydeep Sen, Bhavani Iyer, Martin Franz, Kshitij Fadnis, Mihaela Bornea, Sara Rosenthal, Scott McCarley, Rong Zhang, Vishwajeet Kumar, Yulong Li, Md Arafat Sultan, Riyaz Bhat, Radu Florian, Salim Roukos
ARXIV - Jan 2023 [Papier] [Code]
TRL: Transformator -Verstärkungslernen
Leandro von Werra, Younes Belkada, Lewis Tunstall, Edward Beeching, Tristan Thrush, Nathan Lambert, Shengyi Huang
Github - 2020 [Code]
FACTSCORE: Feinkörnige atomare Bewertung der sachlichen Präzision in Langformtextgenerierung
Sewon Min, Kalpesh Krishna, Xinxi Lyu, Mike Lewis, Wen-Tau Yih, Pang Wei Koh, Mohit Iyyer, Luke Zettlemoyer, Hannaneh Hajishirzi
PYPI - Mai 2023 [Papier] [Code]
FaktKB: Verallgemeinerbare Tatsachenbewertung unter Verwendung von Sprachmodellen, die mit Faktenwissen verbessert wurden
Shangbin Feng, Vidhisha Balachandran, Yuyang Bai, Yulia Tsvetkov
ARXIV - Mai 2023 [Papier] [Code]
Bewertung der Überprüfbarkeit in generativen Suchmaschinen
Nelson F. Liu, Tianyi Zhang, Percy Liang
ARXIV - April 2023 [Papier] [Code]
Workshop über generative KI für Empfehlungssysteme und Personalisierung
Narges Tabari, Aniket Deshmukh, Wang-Cheng Kang, Rashmi Gangadharaja, Hamed Zamani, Julian McAuley, George Karypis
KDD 24 - August 2024 [Link]
Zweiter Workshop zum Abrufen generativer Informationen
Gabriel Bénédict, Ruqing Zhang, Donald Metzler, Andrew Yates, Ziyan Jiang
Sigir 24 - Juli 2024 [Link]
Personalisierte generative KI
Zheng Chen, Ziyan Jiang, Fan Yang, Zhankui He, Yupeng Hou, Eunah Cho, Julian McAuley, Aram Galstyan, Xiaohua Hu, Jie Yang
CIKM 23 - Okt 2023 [Link]
Erster Workshop über Empfehlung mit generativen Modellen
Wenjie Wang, Yong Liu, Yang Zhang, Weiwen Liu, Fuli Feng, Xiangnan er, Aixin Sun
CIKM 23 - Okt 2023 [Link]
Erster Workshop zum Abrufen generativer Informationen
Gabriel Bénédict, Ruqing Zhang, Donald Metzler
Sigir 23 - Juli 2023 [Link]
Abrufbasierte Sprachmodelle und Anwendungen
Akari Asai, Sewon Min, Zexuan Zhong, Danqi Chen
ACL 23 - Juli 2023 [Link]
Agenteninformation Abruf
Weinan Zhang, Junwei Liao, Ning Li, Kounianhua du
ARXIV - OCT 2024 [Papier]
Rezitieren, rekonstruieren, erinnern: Memorisierung in LMS als facettenreiches Phänomen
USVSN Sai Prashanth, Alvin Deng, Kyle O'Brien, Jyothir SV, Mohammad Aflah Khan, Jaydeep Borkar, Christopher A. Choquette-Choo, Jacob Ray Fuehe, Stella Biderman, TRACY KE, KATHERINE, NAOMI SAPHRA SAPHRA
Arxiv - Jun 2024 [Papier]
Chatgpt ist Bullshit
Michael Townsen Hicks, James Humphries, Joe Slater
Ethics Inf Technol - Jun 2024 [Papier]
Halluzination multimodaler Großsprachenmodelle: Eine Umfrage
Zechen Bai, Pichao Wang, Tianjun Xiao, Tong He, Zongbo Han, Zheng Zhang, Mike Zheng Shou
Arxiv - Apr 2024 [Papier]
Von der Übereinstimmung bis zur Generation: Eine Umfrage zum Abrufen generativer Informationen
Xiaoxi Li, Jiajie Jin, Yujia Zhou, Yuyao Zhang, Peitian Zhang, Yutao Zhu und Zhicheng Dou
Arxiv - Apr 2024 [Papier]
Wissenskonflikte für LLMs: Eine Umfrage
Rongwu Xu, Zehan Qi, Cunxiang Wang, Hongru Wang, Yue Zhang, Wei Xu
Arxiv - März 2024 [Papier]
Bericht über den 1. Workshop über generative Informationsabruf (Gen-IR 2023) bei Sigir 2023
Gabriel Bénédict, Ruqing Zhang, Donald Metzler, Andrew Yates, Romain Deffayet, Philipp Hager, Sami Jullien
Sigir Forum - Dezember 2023 [Papier]
Bericht über den 1. Workshop über die aufgabenorientierte IR im Zeitalter der generativen KI
Chirag Shah, Ryen W. White
Sigir Forum - Dezember 2023 [Papier]
Auf dem Weg zur generativen Suche und Empfehlung: Eine Keynote bei Recsys 2023
Tat-Seng Chua
Sigir Forum - Dezember 2023 [Papier]
Großes Suchmodell: Suchstapel in der Zeit von LLMs neu definieren
Liang Wang, Nan Yang, Xiaolong Huang, Linjun Yang, Rangan Majumder, Furu Wei
Sigir Forum - Dezember 2023 [Papier]
Großsprachige Modelle für generative Informationsextraktion: Eine Umfrage
Derong Xu, Wei Chen, Wenjun Peng, Chao Zhang, Tong Xu, Xiangyu Zhao, Xian Wu, Yefeng Zheng, Enhong Chen
ARXIV - Dez. 2023 [Papier]
Dichte Textabruf basierend auf vorbereiteten Sprachmodellen: Eine Umfrage
Wayne Xin Zhao, Jing Liu, Ruiyang Ren, Ji-Rong Wen
TOIS - Dezember 2023 [Papier]
Retrieval-Augmented-Generation für Großsprachmodelle: eine Umfrage
Yunfan Gao, Yun Xiong, Xinyu Gao, Kangxiang Jia, Jinliu Pan, Yuxi Bi, Yi Dai, Jiawei Sun, Haofen Wang
ARXIV - Dez. 2023 [Papier]
Kalibrierte Sprachmodelle müssen halluzinieren
Adam Tauman Kalai, Santosh S. Vempala
Arxiv - Nov 2023 [Papier]
Sirens Lied im KI -Ozean: Eine Umfrage zur Halluzination in großen Sprachmodellen
Yue Zhang, Yafu Li, Leyang Cui, Deng Cai, Lemao Liu, Tingchen Fu, Xinting Huang, Enbo Zhao, Yu Zhang, Yulong Chen, Longyue Wang, anh Tuan Luu, Wei bi, Freda Shi, Shuming Shuming Shi
ARXIV - Sep 2023 [Papier]
Das falsche Versprechen, proprietäre LLMs nachzuahmen
Arnav Gudibande, Eric Wallace, Charlie Snell, Xinyang Geng, Hao Liu, Pieter Abbeel, Sergey Levine, Dawn Song
ARXIV - Mai 2023 [Papier]
Generative Empfehlung: Auf dem Weg zur nächsten Generation empfohlenes Paradigma
Fengji Zhang, Bei Chen, Yue Zhang, Jin Liu, Daoguang Zan, Yi Mao, Jian-Guang Lou, Weizhu Chen
Arxiv - April 2023 [Papier]
Erweiterte Sprachmodelle: Eine Umfrage
Grégoire Mialon, Roberto Dessì, Maria Lomeli, Christoforos Nalmpantis, Ram Pasunuru, Roberta Raileanu, Baptiste Rozière, Timo Schick, Jane Dwivedi-yu, Asli Celikyilmaz, Edouard Grave, Yann Lecun, Thomasicun, Thomasicun
ARXIV - Februar 2023 [Papier]
Generative Sprachmodelle und automatisierte Einflussvorgänge: aufkommende Bedrohungen und potenzielle Minderungen
Josh A. Goldstein, Girish Sastry, Micah Musser, Renee Diresta, Matthew Gentzel, Katerina Sedova
Arxiv - Jan 2023 [Papier]
Konversationsinformationen suchen. Eine Einführung in die Beantwortung von Konversationssuche, Empfehlung und Frage
Hamed Zamani, Johanne R. Trippas, Jeff Dalton und Filip Radlinski
Arxiv - Jan 2023 [Papier]
Fakten
Kevin Mulligan und Fabrice Correia
Die Stanford Encyclopedia of Philosophy - Winter 2021 [URL]
Wahrheitsgemäß
Owain Evans, Owen Cotton-Barratt, Lukas Finneden, Adam Bales, Avital Balwit, Peter Wills, Luca Righetti, William Saunders
ARXIV - OCT 2021 [Papier]
Überdenken suchen: Domänenexperten aus Dilettanten machen
Donald Metzler, Yi Tay, Dara Bahri, Marc Najork
Sigir Forum 2021 - Mai 2021 [Papier]
Zugeschriebene Frage Beantwortung: Bewertung und Modellierung für zugeschriebene Großsprachenmodelle
Bernd Bohnet, Vinh Q. Tran, Pat Verga, Roee Aharoni, Daniel Andor, Livio Baldini Soares, Jacob Eisenstein, Kuzman Ganchev, Jonathan Herzig, Kai Hui, Tom Kwiatkowski, Ji Ma, Jianmo Ni, Tal Schuster, William W. Cohen, Michael Collins, Dipanjan Das, Donald Metzler, Slav Petrov, Kellie Webster
ARXIV - Dez. 2022 [Papier]
externe Erdung/Abruf zum Zeitpunkt der Inferenz
Raptor: rekursive abtraktive Verarbeitung für das organisierte Abruf
Parth Sarthi, Salman Abdullah, Aditi Tuli, Shubh Khanna, Anna Goldie, Christopher D. Manning
ICLR 24 - Jan 2024 [Papier]
Korrektives Abruf Augmented Generation
Shi-Qi Yan, Jia-Chen Gu, Yun Zhu, Zhen-Hua Ling
Arxiv - Jan 2024 [Papier]
Es ist an der Zeit: Temporalität in den Abrufen erweiterten Sprachmodelle einzubeziehen
Anoushka Gade, Jorjeta Jetcheva
Arxiv - Jan 2024 [Papier]
Rag gegen Feinabstimmung: Pipelines, Kompromisse und eine Fallstudie zur Landwirtschaft
Angels Balaguer, Vinamra Benara, Renato Luiz de Freitas Cunha, Roberto de M. Estevão Filho, Todd Hendry, Daniel Holstein, Jennifer Marsman, Nick Mecklenburg, Sara Malvar, Leonardo O. Nunes, Rafael Padilha, Morris Sharp, Bruno Silva, Swati Sharma, Vijay Aski, Ranveer Chandra
Arxiv - Jan 2024 [Papier]
Sequenzierung MA�TERS: Ein Modell für die Generierung des Generate-Generate-Modells zum Aufbau von Konversationsmitteln
Quinn Patwardhan, Grace Hui Yang
TREC 23 - Nov 2023 [Papier]
Selbstabschnitte: Durch die Selbstreflexion lernen, generieren und kritisieren
Anonym
ICLR 24 - Oktober 2023 [Papier]
RA-DIT: Abrufen-doppelte Unterrichtsstimmung
Anonym
ICLR 24 - Oktober 2023 [Papier]
In-Kontext-Lernen mit Abrufenvergrößerungs-Encoder-Decoder-Sprachmodellen
Anonym
ICLR 24 - Oktober 2023 [Papier]
Retrieval-Augmented-Sprachmodelle robust für irrelevanten Kontext machen
Anonym
ICLR 24 - Oktober 2023 [Papier]
Retrieval trifft auf lange Kontext großer Sprachmodelle
Anonym
ICLR 24 - Oktober 2023 [Papier]
Reformulierende Domänenanpassung von Großsprachenmodellen als Anpassungsrückgang-Wiederbelebung
Anonym
ICLR 24 - Oktober 2023 [Papier]
Instructretro: Anweisungsabstimmung nach dem Abrufen von Vorabend
Anonym
ICLR 24 - Oktober 2023 [Papier]
Sicher: Verbesserung der Fragen zur Beantwortung von LLMs mit offener Domänen durch zusammengefasstes Abrufen
Anonym
ICLR 24 - Oktober 2023 [Papier]
Wiederaufnahme: Verbesserung von LMs mit dem Abruf mit Kontextkomprimierung und selektiver Augmentation
Anonym
ICLR 24 - Oktober 2023 [Papier]
Abrufen ist eine genaue Generation
Anonym
ICLR 24 - Oktober 2023 [Papier]
PaperQA: Abruf-generierter Generativagent für wissenschaftliche Forschung
Anonym
ICLR 24 - Oktober 2023 [Papier]
Verständnis des Abrufs Vergrößerung für die Beantwortung von Fragen zur Langformpunkte
Anonym
ICLR 24 - Oktober 2023 [Papier]
Personalisierte Sprachgenerierung über Bayes'sche metrische Augmented Abruf
Anonym
ICLR 24 - Oktober 2023 [Papier]
DSPY: Kompilieren des deklarativen Sprachmodells Aufrufe in selbstverbesserte Pipelines
Omar Khattab, Arnav Singhvi, Paridhi Maheshwari, Zhiyuan Zhang, Keshav Santhanam, Sri Vardhamanan, Saiful Haq, Ashutosh Sharma, Thomas T. Joshi, Hanna Moazam, Heather Miller, Matei Zaharia, Christopher Potts
ARXIV - OCT 2023 [Papier] [Code]
RA-DIT: Abrufen-doppelte Unterrichtsstimmung
Xi Victoria Lin, Xilun Chen, Mingda Chen, Weijia Shi, Maria Lomeli, Rich James, Pedro Rodriguez, Jacob Kahn, Gergly Szilvasy, Mike Lewis, Luke Zettlemoyer, Scott Yih
Arxiv - August 2023 [Papier]
Die Werkzeugdokumentation ermöglicht das Null-Shot-Tool-Nutzung mit großen Sprachmodellen
Cheng-yu Hsieh, Si-an Chen, Chun-liang Li, Yasuhisa Fujii, Alexander Ratner, Chen-yu Lee, Ranjay Krishna, Tomas Pfister
Arxiv - August 2023 [Papier]
Reaugkd: Abruf-ausgelöste Wissensdestillation für vorgebrachte Sprachmodelle
Jianyi Zhang, Aashiq Muhamed, Aditya Anantharaman, Guoyin Wang, Changyou Chen, Kai Zhong, Qingjun Cui, Yi Xu, Belinda Zeng, Trishul Chilimbi, Yiran Chen
ACL 23 - Juli 2023 [Papier]
Die oberflächenbasierte Wiederholung verringert die Verwirrung von revival-uugmentierten Sprachmodellen
Ehsan Doostmohammadi, Tobias Norlund, Marco Kuhlmann, Richard Johansson
ACL 23 - Juli 2023 [Papier]
Weiches Eintauchen zum Augmentieren des dichten Abrufs mit großen Sprachmodellen
Zhiyuan Peng, Xuyang Wu, Yi Fang
Arxiv - Jun 2023 [Papier]
Reta-llm: ein retrieval-ausgelöster großes Sprachmodell-Toolkit
Jiongnan Liu, Jiajie Jin, Zihan Wang, Jiehan Cheng, Zhicheng Dou, Ji-Rong Wen
Arxiv - Jun 2023 [Papier]
WebGLM: Auf dem Weg zu einem effizienten Web-Fragen-Beantwortungssystem mit menschlichen Vorlieben
Xiao Liu, Hanyu Lai, Hao Yu, Yifan Xu, Aohan Zeng, Zhengxiao DU, Peng Zhang, Yuxiao Dong, Jie Tang
Arxiv - Jun 2023 [Papier]
Wikichat: Die Halluzination großer Sprachmodell-Chatbots durch Wikipedia stoppen
Sina J. Semnani, Violet Z. Yao, Heidi C. Zhang, Monica S. Lam
EMNLP -Ergebnisse 2023 - Mai 2023 [Papier] [Code] [Demo]
Ret-llm: Auf dem Weg zu einem allgemeinen Leseschreibergedächtnis für große Sprachmodelle
Ali Modarressi, Ayyoob Imani, Mohsen Fayyaz, Hinrich Schutze
ARXIV - Mai 2023 [Papier]
Gorilla: großes Sprachmodell, das mit massiven APIs verbunden ist
Shishir G. Patil, Tianjun Zhang, Xin Wang, Joseph E. Gonzalez
ARXIV - Mai 2023 [Papier] [Code]
Sollen wir autoregressive Sprachmodelle mit Abruf vorbereitet? Eine umfassende Studie
Boxin Wang, Wei Ping, Peng Xu, Lawrence McAfee, Zihan Liu, Mohammad Shoeybi, Yi Dong, Oleksii Kuchaiev, Bo li, Chaowei Xiao, Anima Anandkumar, Bryan Catanzaro
ARXIV - Apr 2023 [Papier] [Code]
Überprüfen Sie Ihre Fakten und versuchen Sie es erneut: Verbesserung großer Sprachmodelle mit externen Kenntnissen und automatisiertem Feedback
Baolin Peng, Michel Galley, Pengcheng HE, Hao Cheng, Yujia Xie, Yu Hu, Qiuyuan Huang, Lars Liden, Zhou Yu, Weishu Chen, Jianfeng Gao
ARXIV - Februar 2023 [Papier] [Code]
Toolformer: Sprachmodelle können sich beibringen, Tools zu verwenden
Timo Schick, Jane Dwivedi-yu, Roberto Dessì, Roberta Raileanu, Maria Lomeli, Luke Zettlemoyer, Nicola Cancedda, Thomas Scialom
ARXIV - Februar 2023 [Papier]
Wiederholung: Abrufen-Black-Box-Sprachmodelle mit Abrufen
Weijia Shi, Sewon Min, Michihiro Yasunaga, Minjoon Seo, Rich James, Mike Lewis, Luke Zettlemoyer, Wen-Tau Yih
Arxiv - Jan 2023 [Papier]
In-kontext-regelweitsprachige Sprachmodelle
Ori Ram, Yoav Levine, Itay Dalmedigos, Dor Muhlgay, Amnon Shashua, Kevin Leyton-Brown, Yoav Shoham
AI21 Labs - Jan 2023 [Papier] [Code]
Rezepte zum Erstellen eines Open-Domain-Chatbots
Stephen Roller, Emily Dinan, Naman Goyal, DA Ju, Mary Williamson, Yinhan Liu, Jing Xu, Myle Ott, Eric Michael Smith, Y-Lan Boureau, Jason Weston
EACL 2021 - Apr 2021 [Papier]
ATMAN: Verständnis von Transformatorvorhersagen durch Gedächtnis -effiziente Aufmerksamkeit Manipulation
Hamed Zamani, Johanne R. Trippas, Jeff Dalton und Filip Radlinski
Arxiv - Jan 2023 [Papier]
Retromae V2: Duplex Masked Auto-Codher für abtrainingorientierte Sprachmodelle
Shitao Xiao, Zheng Liu
Arxiv - Nov 2023 [Papier]
Demonstrate-Search-Vorhersage: Komponieren von Abruf- und Sprachmodellen für wissensintensiv
ARXIV - Dez. 2022 [Papier]
Verbesserung der Sprachmodelle durch Abrufen von Billionen Token
Sebastian Borgeaud, Arthur Mensch, Jordan Hoffmann, Trevor Cai, Eliza Rutherford, Katie Millican, George van den Driessche, Jean-Baptiste Lespiau, Bogdan Damoc, Aidan Clark, Diego de Las Casas, Aurelia Guy, Jacob Menick, Roman Ring, Tom Hennigan, Saffron Huang, Loren Maggiore, Chris Jones, Albin Cassirer, Andy Brock, Michela Paganini, Geoffrey Irving, Oriol Vinyals, Simon Osftift, Karen Simonyan, Jack W. Rae, Erich Elsen und Laurent Sifre
ARXIV - Februar 2022 [Papier]
Verbesserung der Sprachmodelle durch Abrufen von Billionen Token
Sebastian Borgeaud, Arthur Mensch, Jordan Hoffmann, Trevor Cai, Eliza Rutherford, Katie Millican, George van den Driessche, Jean-Baptiste Lespiau, Bogdan Damoc, Aidan Clark, Diego de Las Casas, Aurelia Guy, Jacob Menick, Roman Ring, Tom Hennigan, Saffron Huang, Loren Maggiore, Chris Jones, Albin Cassirer, Andy Brock, Michela Paganini, Geoffrey Irving, Oriol Vinyals, Simon Osftift, Karen Simonyan, Jack W. Rae, Erich Elsen, Laurent Sifre
ARXIV - Dez. 2021 [Papier]
WebGPT: Browser-unterstützte Fragen-Beantwortung mit menschlichem Feedback
Reiichiro Nakano, Jacob Hilton, Suchir Balaji, Jeff Wu, Long Ouyang, Christina Kim, Christopher Hesse, Shantanu Jain, Vineet Kosaraju, William Saunders, Xu Jiang, Karl Cobbe, Tyna Eloundou, Gretchen Krueger, Kevin Button, Matthew Knight, Benjamin Chess, John Schulman
ARXIV - Dez. 2021 [Papier]
Bert-Knn: Hinzufügen einer KNN-Suchkomponente zu vorbereiteten Sprachmodellen für eine bessere QS
Nora Kassner, Hinrich Schütze
EMNLP 2020 - Nov 2020 [Papier]
Realm: Abrufen-Sprachmodell vor dem Training
Kelvin Guu, Kenton Lee, Zora Tung, Panupong Pasupat, Ming-Wei Chang
ICML 2020 - Juli 2020 [Papier]
Ein neuronales Konversationsmodell der Hybrid-Retrievale Generation
Liu Yang, Junjie Hu, Minghui Qiu, Chen Qu, Jianfeng Gao, W. Bruce Croft, Xiaodong Liu, Yelong Shen, Jingjing Liu
ARXIV - APR 2019 [Papier]
auf Inferenzzeit in internen Modellgewichten begründet
Wie erwerben große Sprachmodelle während der Vorbereitung Sachkenntnisse?
Hoyeon Chang, Jinho Park, Seonghyeon Ye, Sohee Yang, Youngkyung Seo, Du-Seong Chang, Minjoon Seo
Arxiv - Jun 2024 [Papier]
Feinabstimmungssprachmodelle für Sachlichkeit
Katherine Tian, Eric Mitchell, Huaxiu Yao, Christopher D. Manning, Chelsea Finn
Arxiv - Nov 2023 [Papier]
R-Tuning: Großsprachmodelle unterrichten, um unbekannte Fragen zu verweigern
Hanning Zhang, Shizhe Diao, Yong Lin, Yi R. Pilz, Qing Lian, Xingyao Wang, Yangyi Chen, Heng JI, Tong Zhang
Arxiv - Nov 2023 [Papier]
EasyEdit: Ein benutzerfreundlicher Wissensbearbeitungsrahmen für große Sprachmodelle
Peng Wang, Ningyu Zhang, Xin Xie, Yunzhi Yao, Bozhong Tian, Mengru Wang, Zekun XI, Siyuan Cheng, Kangwei Liu, Guozhou Zheng, Huajun Chen
Arxiv - August 2023 [Papier]
Inspizieren und Bearbeiten von Wissensdarstellungen in Sprachmodellen
Evan Hernandez, Belinda Z. Li, Jacob Andreas
ARXIV - Apr 2023 [Papier] [Code]
Durch das Abrufen von Passagen mit generativen Modellen für die Beantwortung offener Domänen einsetzen
Gautier Izacard, Edouard Grab
ARXIV - Februar 2023 [Papier]
Latentwissen in Sprachmodellen ohne Aufsicht entdecken
Collin Burns, Haotian Ye, Dan Klein, Jacob Steinhardt
ICLR 23 - Februar 2023 [Papier] [Code]
Galactica: Ein großes Sprachmodell für die Wissenschaft
Ross Taylor, Marcin Kardas, Guillem Cucurull, Thomas Scialom, Anthony Hartshorn, Elvis Saravia, Andrew Poulton, Viktor Kerkez, Robert Stojnic
Galactica.org - 2022 [Papier]
Blenderbot 3: Ein bereitgestellter Konversationsagent, der ständig lernt, sich verantwortungsbewusst zu engagieren
Kurt Shuster, Jing Xu, Mojtaba Komeili, Da Ju, Eric Michael Smith, Stephen Roller, Megan Ung, Moya Chen, Kushal Arora, Joshua Lane, Morteza Behrooz, William Ngan, Spencer Poff, Naman Goyal, Arthur Szlam, Y-Lan Boureau, Melanie Kambadur, Jason Weston
Arxiv - August 2022 [Papier]
Generieren Sie eher als abzurufen: Großsprachenmodelle sind starke Kontextgeneratoren
Wenhao Yu, Dan Iter, Shuohang Wang, Yichong Xu, Mingxuan Ju, Soumya Sanyal, Chenguang Zhu, Michael Zeng, Meng Jiang
ICLR 2023 - September 2022 [Papier]
Rezitations-ausgereifte Sprachmodelle
Zhiqing Sun, Xuezhi Wang, Yi Tay, Yiming Yang, Denny Zhou
ICLR 2023 - September 2022 [Papier]
Verbesserung der Ausrichtung von Dialogagenten durch gezielte menschliche Urteile
Amelia Glaese, Nat McAleese, Maja Trębacz, John Aslanides, Vlad Firoiu, Timo Ewalds, Maribeth Rauh, Laura Weidinger, Martin Chadwick, Phoebe Thacker, Lucy Campbell-Gillingham, Jonathan Uesato, Po-Sen Huang, Ramona Comanescu, Fan Yang, Abigail See, Sumanth Dathathri, Rory Greig, Charlie Chen, Doug Fritz, Jaume Sanchez Elias, Richard Green, Soňa Mokrá, Nicholas Fernando, Boxi Wu, Rachel Foley, Susannah Young, Iason Gabriel, William Isaac, John Mellor, Demis Hassabis, Koray Kavukcuoglu, Lisa Anne Hendricks, Geoffrey Irving
ARXIV - Sep 2022 [Papier]
LAMDA: Sprachmodelle für Dialoganwendungen
Romal Thoppilan, Daniel De Freitas, Jamie Hall, Noam Shazeer, Apoorv Kulshreshtha, Heng-Tze Cheng, Alicia Jin, Taylor Bos, Leslie Baker, Yu Du, YaGuang Li, Hongrae Lee, Huaixiu Steven Zheng, Amin Ghafouri, Marcelo Menegali, Yanping Huang, Maxim Krikun, Dmitry Lepikhin, James Qin, Dehao Chen, Yuanzhong Xu, Zhifeng Chen, Adam Roberts, Maarten Bosma, Vincent Zhao, Yanqi Zhou, Chung-Ching Chang, Igor Krivokon, Will Rusch, Marc Pickett, Pranesh Srinivasan, Laichee Man, Kathleen Meier-Hellstern, Meredith Ringel Morris, Tulsee Doshi, Renelito Delos Santos, Toju Duke, Johnny Soraker, Ben Zevenbergen, Vinodkumar Prabhakaran, Mark Diaz, Ben Hutchinson, Kristen Olson, Alejandra Molina, Erin Hoffman-John, Josh Lee, Lora Aroyo, Ravi Rajakumar, Alena Butyna, Matthew Lamm, Viktoriya Kuzmina, Joe Fenton, Aaron Cohen, Rachel Bernstein, Ray Kurzweil, Blaise Aguera-Arcas, Claire CUI, Marian Croak, Ed Chi, Quoc Le Le
Arxiv - Jan 2022 [Papier]
Sprachmodelle als oder für Wissensbasen
Simon Razniewski, Andrew Yates, Nora Kassner, Gerhard Weikum
DL4KG 2021 - Oktober 2021 [Papier]
Verallgemeinerung durch Auswendiglernen: Nächste Nachbarsprachmodelle
Urvashi Khandelwal, Omer Levy, Dan Jurafsky, Luke Zettlemoyer, Mike Lewis
ICLR 2020 - September 2019 [Papier] [Code]
Ist Chatgpt gut bei der Suche? Untersuchung großer Sprachmodelle als Wiederaufnahme von Agenten
Wenhao Yu, Hongming Zhang, Xiaoman Pan, Kaixin MA, Hongwei Wang, Dong Yu
Arxiv - Nov 2023 [Papier]
Die Anweisungsdestillation macht große Sprachmodelle effiziente Null-Shot-Ranger
Weiwei Sonne, Zheng Chen, Xinyu MA, Lingyong Yan, Shuaiqiang Wang, Pengjie Ren, Zhumin Chen, Dawei Yin, Zhaochun Ren
ARXIV 2023 - Nov 2023 [Papier]
Kritiker: Großsprachige Modelle können sich mit Werkzeuginteraktiven kritisieren
Zhibin Gou, Zhihong Shao, Yeyun Gong, Yelong Shen, Yujiu Yang, Nan Duan, Weizhu Chen
ICLR 2024 - Jan 2024 [Papier]
Ein Stich in der Zeit spart neun
Neeraj Varshny, Wenlin Yao, Hongming Zhang, Jianshu Chen, Dong Yu
Arxiv - August 2023 [Papier]
Rarr: Nachforschungen und Überarbeiten, was Sprachmodelle mithilfe von Sprachmodellen sagen
Luyu Gao, Zhuyun Dai, Panupong Pasupat, Anthony Chen, Arun Tejasvi Chaganty, Yicheng-Fan, Vincent Zhao, Ni Lao, Hononglae Lee, Da-Cheg Juan, Kelvin Guu
ACL 2023 - Juli 2023 [Papier]
Verify-and-Dit: Ein wissensbedingter Kette des Gedanke
Ruochen Zhao, Xingxuan Li, Shafiq Joty, Chengwei Qin, Lidong Bing
ACL 2023 - Juli 2023 [Papier]
Aktive Erzielung der Abrufer Generation
Zhengbao Jiang, Frank F. Xu, Luyu Gao, Zhiqing Sun, Qian Liu, Jane Dwivedi-yu, Yiming Yang, Jamie Callan, Graham Neuubig
ARXIV - Mai 2023 [Papier] [Code]
Verbesserung der Sprachmodelle durch Plug-and-Play-Abruffeedback
Wenhao Yu, Zhihan Zhang, Zhenwen Liang, Meng Jiang, Ashish Sabharwal
ARXIV - Mai 2023 [Papier]
Sprachkalibrierung von Langformgenerationen
Neil Band, Xuechen Li, Tengyu MA, Tatsunori Hashimoto
ARXIV 2024 - Jun 2024 [Papier]
Zu glauben oder nicht Ihrer LLM zu glauben
Yasin Abbasi Yadkori, Ilja Kuzborskij, András György, Csaba Szepesvárii
ARXIV 2024 - Jun 2024 [Papier]
Sayself: LLMs lehren
Tianyang Xu, Shujin Wu, Shizhe Diao, Xiaoze Liu, Xingyao Wang, Yangyi Chen, Jing Gao
ARXIV 2024 - Mai 2024 [Papier]
Experten betrügen nicht: Lernen, was Sie nicht wissen, indem Sie Paare vorherigen
Daniel D. Johnson, Daniel Tarlow, David Duvenaud, Chris J. Maddison
ARXIV 2024 - Februar 2024 [Papier]
Entsperren der vorweggenommenen Textgenerierung: Ein eingeschränkter Ansatz für die treue Dekodierung mit großen Sprachmodellen
Anonym
ICLR 24 - Oktober 2023 [Papier]
DOLA: Decodieren durch Kontrastschichten verbessert die Sachlichkeit in großen Sprachmodellen
Yung-Sung Chuang, Yujia Xie, Hongyin Luo, Yoon Kim, James Glass, Pengcheng er
ICLR 24 - September 2023 [Papier]
Ein datenorientierter Ansatz, um treue und qualitativ hochwertige Patientenzusammenfassungen mit großen Sprachmodellen zu erzeugen
Stefan Hegselmann, Shannon Zejiang Shen, Florian Gierse, Monica Agrawal, David Sontag, Xiaoyi Jiang
ARXIV 24 - Februar 2024 [Papier]
Stochastischer Lappen: End-to-End-Retrieval-Augment-Generation durch die erwartete Nützlichkeitsmaximierung
Hamed Zamani, Michael Bendersky
ARXIV 24 - Mai 2024 [Papier]
Konstitutionelle KI: Harmlosigkeit durch KI -Feedback
Yuntao Bai, Saurav Kadavath, Sandipan Kundu, Amanda Askell, Jackson Kernion, Andy Jones, Anna Chen, Anna Goldie, Azalia Mirhoseini, Cameron McKinnon, Carol Chen, Catherine Olsson, Christopher Olah, Danny Hernandez, Dawn Drain, Deep Ganguli, Dustin Li, Eli Tran-Johnson, Ethan Perez, Jamie Kerr, Jared Mueller, Jeffrey Ladish, Joshua Landau, Kamal Ndousse, Kamile Lukosiute, Liane Lovitt, Michael Sellitto, Nelson Elhage, Nicholas Schiefer, Noemi Mercado, Nova DasSarma, Robert Lasenby, Robin Larson, Sam Ringer, Scott Johnston, Shauna Kravec, Sheer El Showk, Stanislav Fort, Tamera Lanham, Timothy Telleen-Lawton, Tom Conerly, Tom Henighan, Tristan Hume, Samuel R. Bowman, Zac Hatfield-Dodds, Ben Mann, Dario Amodei, Nicholas Joseph, Sam McCandlish, Tom Brown, Jared Kaplan und Thropic.com -2022 [Paperlan
Neue Fähigkeiten nach der Bereitstellung lernen: Verbesserung des Internet-gesteuerten Dialogs mit offener Domänen mit menschlichem Feedback
Jing Xu, Megan Ung, Mojtaba Komeili, Kushal Arora, Y-Lan Boureau, Jason Weston
Arxiv - August 2022 [Papier]
Wiederholungsmultimodale Sprachmodellierung
Michihiro Yasunaga, Armen Aghajanyan, Weijia Shi, Rich James, Jure Leskovec, Percy Liang, Mike Lewis, Luke Zettlemoyer, Wen-Tau Yih
Arxiv - Nov 2022 [Papier]
RAMM: Abruf-ausgerüstete biomedizinische visuelle Frage zur Beantwortung von multimodalem Vorbild
Zheng Yuan, Qiao Jin, Chuanqi Tan, Zhengyun Zhao, Hongyi Yuan, Fei Huang, Songfang Huang
Arxiv - März 2023 [Papier]
Verschachtung des Abrufs mit der Kette des Gedankens für wissensintensive mehrstufige Fragen harsh Trivedi, Niranjan Balasubramanian, Tushar Khot und Ashish Sabharwal ACL 23-Juli 2023 [Papier] [Papier]
Reagieren: Synergisierung von Argumentation und Handeln in Sprachmodellen
Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan du, Izhak Shafran, Karthik Narasimhan, Yuan Cao
ARXIV - Okt 2022 [Papier]
Repocoder: Code-Abschluss auf Repository-Ebene durch iteratives Abrufen und Generation
Fengji Zhang, Bei Chen, Yue Zhang, Jin Liu, Daoguang Zan, Yi Mao, Jian-Guang Lou, Weizhu Chen
Arxiv - März 2023 [Papier]
DOCPROMPING: Generieren von Code durch Abrufen der DOCs
Shuyan Zhou, Uri Alon, Frank F. Xu, Zhiruo Wang, Zhengbao Jiang, Graham Neuubig
ICLR 23 - Jul 2022 [Papier] [Code] [Daten]
Generieren, Filter und Sicherung: Abfragenerweiterung über mehrstufige Schlüsselwortgenerierung für Null-Shot-Neuralranger
Minghan Li, Honglei Zhuang, Kai Hui, Zhen Qin, Jimmy Lin, Rolf Jagerman, Xuanhui Wang, Michael Bendersky
Arxiv - Nov 2023 [Papier]
Agent4Ranking: Semantisches robustes Ranking über personalisierte Abfrage-Umschreiben mit Multi-Agent-LLM
Xiaopeng Li, Lixin SU, Pengyue Jia, Xiangyu Zhao, Suqi Cheng, Junfeng Wang, Dawei Yin
ARXIV - Dez. 2023 [Papier]
Einheitliche generative und dichte Wiederherstellung für die Umschreibung von Abfragen in gesponserter Suche
Akash Kumar Mohankumar, Bhargav Dodla, Gururaj K, Amit Singh
ARXIV - Sep 2022 [Papier]
Erzeugen sachlich konsequentes Sport hebt Erzählungen hervor
Noah Sarfati, Ido Yerushalmy, Michael Chertok, Yosi Keller
MMMSports 2023 - 23. Oktober [Papier]
Genetische generative Informationsabnahme
Hrishikesh Kulkarni, Zachary Young, Nazli Goharian, Ophir Frieder, Sean Macavaney
Doceng 23 - 23. August [Papier]
Lernen, mit menschlichem Feedback zusammenzufassen
Nisan Stieennon, Long Ouyang, Jeff Wu, Daniel M. Ziegler, Ryan Lowe, Chelsea Voss, Alec Radford, Dario Amodei, Paul Christiano
NeurIPS 2020 – Sep 2020 [paper]
On Faithfulness and Factuality in Abstractive Summarization
Joshua Maynez, Shashi Narayan, Bernd Bohnet, Ryan McDonald
ACL 2020 – May 2020 [paper]
Augment before You Try: Knowledge-Enhanced Table Question Answering via Table Expansion
Yujian Liu, Jiabao Ji, Tong Yu, Ryan Rossi, Sungchul Kim, Handong Zhao, Ritwik Sinha, Yang Zhang, Shiyu Chang
arXiv – Jan 2024 [paper]
We jump-started this section by reusing the content of awesome-generative-retrieval-models and give full credit to Chriskuei for that! We now have added some content on top.
De-DSI: Decentralised Differentiable Search Index
Petru Neague, Marcel Gregoriadis, Johan Pouwelse
EuroMLSys 24 – Apr 2024 [paper]
Listwise Generative Retrieval Models via a Sequential Learning Process
Yubao Tang, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Wei Chen, Xueqi Cheng
TOIS 2024 – Mar 2024 [Paper]
Distillation Enhanced Generative Retrieval
Yongqi Li, Zhen Zhang, Wenjie Wang, Liqiang Nie, Wenjie Li, Tat-Seng Chua
arXiv 2024 – Feb 2024 [Paper]
Self-Retrieval: Building an Information Retrieval System with One Large Language Model
Qiaoyu Tang, Jiawei Chen, Bowen Yu, Yaojie Lu, Cheng Fu, Haiyang Yu, Hongyu Lin, Fei Huang, Ben He, Xianpei Han, Le Sun, Yongbin Li
arXiv 2024 – Feb 2024 [Paper]
Generative Dense Retrieval: Memory Can Be a Burden
Peiwen Yuan, Xinglin Wang, Shaoxiong Feng, Boyuan Pan, Yiwei Li, Heda Wang, Xupeng Miao, Kan Li
EACL 2024 - Jan 2024 [paper] [code]
Auto Search Indexer for End-to-End Document Retrieval
Tianchi Yang, Minghui Song, Zihan Zhang, Haizhen Huang, Weiwei Deng, Feng Sun, Qi Zhang
EMNLP 2023 - December 23 [paper]
DiffusionRet: Diffusion-Enhanced Generative Retriever using Constrained Decoding
Shanbao Qiao, Xuebing Liu, Seung-Hoon Na
EMNLP Findings 2023 – Dec 2023 [paper]
Scalable and Effective Generative Information Retrieval
Hansi Zeng, Chen Luo, Bowen Jin, Sheikh Muhammad Sarwar, Tianxin Wei, Hamed Zamani
WWW 2024 - Nov 2023 [paper] [code]
Nonparametric Decoding for Generative Retrieval
Hyunji Lee, JaeYoung Kim, Hoyeon Chang, Hanseok Oh, Sohee Yang, Vladimir Karpukhin, Yi Lu, Minjoon Seo
ACL Findings 2023 – Jul 2023 [paper]
Model-enhanced Vector Index
Hailin Zhang, Yujing Wang, Qi Chen, Ruiheng Chang, Ting Zhang, Ziming Miao, Yingyan Hou, Yang Ding, Xupeng Miao, Haonan Wang, Bochen Pang, Yuefeng Zhan, Hao Sun, Weiwei Deng, Qi Zhang, Fan Yang, Xing Xie, Mao Yang, Bin Cui
NeurIPS 2023 – May 2023 [paper] [code]
Continual Learning for Generative Retrieval over Dynamic Corpora
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Wei Chen, Yixing Fan, Xueqi Cheng
CIKM 2023 - Aug 2023 [paper]
Learning to Rank in Generative Retrieval
Yongqi Li, Nan Yang, Liang Wang, Furu Wei, Wenjie Li
arXiv – Jun 2023 [paper]
Large Language Models are Built-in Autoregressive Search Engines
Noah Ziems, Wenhao Yu, Zhihan Zhang, Meng Jiang
ACL Findings 2023 – May 2023 [paper]
Multiview Identifiers Enhanced Generative Retrieval
Yongqi Li, Nan Yang, Liang Wang, Furu Wei, Wenjie Li
ACL 2023 – May 2023 [paper]
How Does Generative Retrieval Scale to Millions of Passages?
Ronak Pradeep, Kai Hui, Jai Gupta, Adam D. Lelkes, Honglei Zhuang, Jimmy Lin, Donald Metzler, Vinh Q. Tran
arXiv – May 2023 [paper]
TOME: A Two-stage Approach for Model-based Retrieval
Ruiyang Ren, Wayne Xin Zhao, Jing Liu, Hua Wu, Ji-Rong Wen, Haifeng Wang
ACL 2023 - May 2023 [paper]
Understanding Differential Search Index for Text Retrieval
Xiaoyang Chen, Yanjiang Liu, Ben He, Le Sun, Yingfei Sun
ACL Findings 2023 - May 2023 [paper]
Learning to Tokenize for Generative Retrieval
Weiwei Sun, Lingyong Yan, Zheng Chen, Shuaiqiang Wang, Haichao Zhu, Pengjie Ren, Zhumin Chen, Dawei Yin, Maarten de Rijke, Zhaochun Ren
arXiv – Apr 2023 [paper]
DynamicRetriever: A Pre-trained Model-based IR System Without an Explicit Index
Yu-Jia Zhou, Jing Yao, Zhi-Cheng Dou, Ledell Wu, Ji-Rong Wen
Machine Intelligence Research – Jan 2023 [paper]
DSI++: Updating Transformer Memory with New Documents
Sanket Vaibhav Mehta, Jai Gupta, Yi Tay, Mostafa Dehghani, Vinh Q. Tran, Jinfeng Rao, Marc Najork, Emma Strubell, Donald Metzler
arXiv – Dec 2022 [paper]
CodeDSI: Differentiable Code Search
Usama Nadeem, Noah Ziems, Shaoen Wu
arXiv – Oct 2022 [paper]
Contextualized Generative Retrieval
Hyunji Lee, Jaeyoung Kim, Hoyeon Chang, Hanseok Oh, Sohee Yang, Vlad Karpukhin, Yi Lu, Minjoon Seo
arXiv – Oct 2022 [paper]
Transformer Memory as a Differentiable Search Index
Yi Tay, Vinh Q. Tran, Mostafa Dehghani, Jianmo Ni, Dara Bahri, Harsh Mehta, Zhen Qin, Kai Hui, Zhe Zhao, Jai Gupta, Tal Schuster, William W. Cohen, Donald Metzler
Neurips 2022 – Oct 2022 [paper] [Video] [third-party code]
A Neural Corpus Indexer for Document Retrieval
Wang et al.
Arxiv 2022 [paper]
Bridging the Gap Between Indexing and Retrieval for Differentiable Search Index with Query Generation
Shengyao Zhuang, Houxing Ren, Linjun Shou, Jian Pei, Ming Gong, Guido Zuccon, and Daxin Jiang
Arxiv 2022 [paper] [Code]
DynamicRetriever: A Pre-training Model-based IR System with Neither Sparse nor Dense Index
Zhou et al
Arxiv 2022 [paper]
Ultron: An Ultimate Retriever on Corpus with a Model-based Indexer
Zhou et al
Arxiv 2022 [paper]
Planning Ahead in Generative Retrieval: Guiding Autoregressive Generation through Simultaneous Decoding
Hansi Zeng ,Chen Luo ,Hamed Zamani
arXiv – Apr 2024 [paper] [Code]
NOVO: Learnable and Interpretable Document Identifiers for Model-Based IR
Zihan Wang, Yujia Zhou, Yiteng Tu, Zhicheng Dou
CIKM 2023 - October 2023 [paper]
Generative Retrieval as Multi-Vector Dense Retrieval
Shiguang Wu, Wenda Wei, Mengqi Zhang, Zhumin Chen, Jun Ma, Zhaochun Ren, Maarten de Rijke, Pengjie Ren
SIGIR 2024 - March 24 [paper] [Code]
Re3val: Reinforced and Reranked Generative Retrieval
EuiYul Song, Sangryul Kim, Haeju Lee, Joonkee Kim, James Thorne
EACL Findings 2023 – Jan 24 [paper]
GLEN: Generative Retrieval via Lexical Index Learning
Sunkyung Lee, Minjin Choi, Jongwuk Lee
EMNLP 2023 - December 23 [paper] [Code]
Enhancing Generative Retrieval with Reinforcement Learning from Relevance Feedback
Yujia Zhou, Zhicheng Dou, Ji-Rong Wen
EMNLP 2023 - December 23 [paper]
Generative Retrieval with Large Language Models
Anonym
ICLR 24 – October 23 [paper]
Semantic-Enhanced Differentiable Search Index Inspired by Learning Strategies
Yubao Tang, Ruqing Zhang, Jiafeng Guo, Jiangui Chen, Zuowei Zhu, Shuaiqiang Wang, Dawei Yin, Xueqi Cheng
KDD 2023 – May 2023 [paper]
Term-Sets Can Be Strong Document Identifiers For Auto-Regressive Search Engines
Peitian Zhang, Zheng Liu, Yujia Zhou, Zhicheng Dou, Zhao Cao
arXiv – May 2023 [paper] [Code]
A Unified Generative Retriever for Knowledge-Intensive Language Tasks via Prompt Learning
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Yiqun Liu, Yixing Fan, Xueqi Cheng
SIGIR 2023 – Apr 2023 [paper] [Code]
CorpusBrain: Pre-train a Generative Retrieval Model for Knowledge-Intensive Language Tasks
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Yiqun Liu, Yixing Fan, Xueqi Cheng
CIKM 2022 – Aug 2022 [paper] [Code]
Autoregressive Search Engines: Generating Substrings as Document Identifiers
Michele Bevilacqua, Giuseppe Ottaviano, Patrick Lewis, Wen-tau Yih, Sebastian Riedel, Fabio Petroni
arXiv – Apr 2022 [paper] [Code]
Autoregressive Entity Retrieval
Nicola De Cao, Gautier Izacard, Sebastian Riedel, Fabio Petroni
ICLR 2021 – Oct 2020 [paper] [Code]
Data-Efficient Autoregressive Document Retrieval for Fact Verification
James Thorne
SustaiNLP@EMNLP 2022 – Nov 2022 [paper]
GERE: Generative Evidence Retrieval for Fact Verification
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Yixing Fan, Xueqi Cheng
SIGIR 2022 [paper] [Code]
Generative Multi-hop Retrieval
Hyunji Lee, Sohee Yang, Hanseok Oh, Minjoon Seo
arXiv – Apr 2022 [paper]
Improving LLMs for Recommendation with Out-Of-Vocabulary Tokens
Ting-Ji Huang, Jia-Qi Yang, Chunxu Shen, Kai-Qi Liu, De-Chuan Zhan, Han-Jia Ye
arXiv – Jun 2024 [paper]
Plug-in Diffusion Model for Sequential Recommendation
Haokai Ma, Ruobing Xie, Lei Meng, Xin Chen, Xu Zhang, Leyu Lin, Zhanhui Kang
arXiv – Jan 2024 [paper]
Towards Graph-Aware Diffusion Modeling For Collaborative Filtering Yunqin Zhu1, Chao Wang, Hui Xiong
arXiv – Nov 2023 [paper]
RecMind: Large Language Model Powered Agent For Recommendation
Yancheng Wang, Ziyan Jiang, Zheng Chen, Fan Yang, Yingxue Zhou, Eunah Cho, Xing Fan, Xiaojiang Huang, Yanbin Lu, Yingzhen Yang
arXiv – Aug 2023 [paper]
Is ChatGPT Fair for Recommendation? Evaluating Fairness in Large Language Model Recommendation
Jizhi Zhang, Keqin Bao, Yang Zhang, Wenjie Wang, Fuli Feng, Xiangnan He
Recsys 2023 – Jul 2023 [paper]
RecFusion: A Binomial Diffusion Process for 1D Data for Recommendation
Gabriel Bénédict, Olivier Jeunen, Samuele Papa, Samarth Bhargav, Daan Odijk, Maarten de Rijke
arXiv – Jun 2023 [paper]
A First Look at LLM-Powered Generative News Recommendation
Qijiong Liu, Nuo Chen, Tetsuya Sakai, Xiao-Ming Wu
arXiv – Jun 2023 [paper]
Large Language Models as Zero-Shot Conversational Recommenders
Yupeng Hou, Junjie Zhang, Zihan Lin, Hongyu Lu, Ruobing Xie, Julian McAuley, Wayne Xin Zhao
arXiv – May 2023 [paper]
DiffuRec: A Diffusion Model for Sequential Recommendation
Zihao Li, Aixin Sun, Chenliang Li
arXiv – Apr 2023 [paper]
Diffusion Recommender Model
Wenjie Wang, Yiyan Xu, Fuli Feng, Xinyu Lin, Xiangnan He, Tat-Seng Chua
SIGIR 2023 – Apr 2023 [paper]
Blurring-Sharpening Process Models for Collaborative Filtering
Jeongwhan Choi, Seoyoung Hong, Noseong Park, Sung-Bae Cho
SIGIR 2023 – Apr 2023 [paper] [code]
Recommender Systems with Generative Retrieval
Shashank Rajput, Nikhil Mehta, Anima Singh, Raghunandan Keshavan, Trung Vu, Lukasz Heldt, Lichan Hong, Yi Tay, Vinh Q. Tran, Jonah Samost, Maciej Kula, Ed H. Chi, Maheswaran Sathiamoorthy
non-archival – Mar 2023 [paper]
Pre-train, Prompt and Recommendation: A Comprehensive Survey of Language Modelling Paradigm Adaptations in Recommender Systems
Peng Liu, Lemei Zhang, Jon Atle Gulla
arXiv – Feb 2023 [paper]
Generative Slate Recommendation with Reinforcement Learning
Romain Deffayet, Thibaut Thonet, Jean-Michel Renders, and Maarten de Rijke
WSDM 2023 – Feb 2023 [paper]
Recommendation via Collaborative Diffusion Generative Model
Joojo Walker, Ting Zhong, Fengli Zhang, Qiang Gao, Fan Zhou
KSEM 2022 – Aug 2022 [paper]
DocGraphLM: Documental Graph Language Model for Information Extraction
Dongsheng Wang, Zhiqiang Ma, Armineh Nourbakhsh, Kang Gu, Sameena Shah
arXiv – Jan 2024 [paper]
KBFormer: A Diffusion Model for Structured Entity Completion
Ouail Kitouni, Niklas Nolte, James Hensman, Bhaskar Mitra
arXiv – Dec 2023 [paper]
From Retrieval to Generation: Efficient and Effective Entity Set Expansion
Shulin Huang, Shirong Ma, Yangning Li, Yinghui Li, Hai-Tao Zheng, Yong Jiang
arXiv – Apr 2023 [paper]
Crawling the Internal Knowledge-Base of Language Models
Roi Cohen, Mor Geva, Jonathan Berant, Amir Globerson
arXiv – Jan 2023 [paper]
Prompt Tuning or Fine-Tuning - Investigating Relational Knowledge in Pre-Trained Language Models
Leandra Fichtel, Jan-Christoph Kalo, Wolf-Tilo Balke
AKBC 2021 – [paper]
Language Models as Knowledge Bases?
Fabio Petroni, Tim Rocktäschel, Patrick Lewis, Anton Bakhtin, Yuxiang Wu, Alexander H. Miller, Sebastian Riedel
EMNLP 2019 – Sep 2019 [paper]
Although some of these are not accompanied by a paper, they might be useful to other Generative IR researchers for empirical studies or interface design considerations.
⚡ Gemini Dec 2023 [live] ⚡️ factiverse Jun 2023 [live] ⚡️ devmarizer Mar 2023 [live] ⚡️ TaxGenius Mar 2023 [live] ⚡️ doc-gpt Mar 2023 [live] ⚡️ book-gpt Feb 2023 [live] ⚡️ Neeva Feb 2023 [live] ⚡️ Golden Retriever Feb 2023 [live] ⚡️ Bing – Prometheus Feb 2023 [waitlist] ⚡️ Google – Bard Feb 2023 [only in certain countries] ⚡️ Paper QA Feb 2023 [code] [demo] ⚡️ DocsGPT Feb 2023 [live] [code] ⚡️ DocAsker Jan 2023 [live] ⚡️ Lexii.ai Jan 2023 [live] ⚡️ YOU.com Dec 2022 [live] ⚡️ arXivGPT Dec 2022 [Chrome extension] ⚡️ GPT Index Nov 2022 [API] ⚡️ BlenderBot Aug 2022 [live (USA)] [model weights] [code] [paper1] [paper2] ⚡️ PHIND date? [live] ⚡️ Perplexity date? [live] ⚡️ Galactica date? [demo] [API] [paper] ⚡️ Elicit date? [live] ⚡️ ZetaAlpha date? [live] uses OpenAI API
To get just the paper titles do grep '**' README.md | sed 's/**//g'