会話モデルは、Webにアクセスしたり、ソースでクレームをバックアップできるようになり始めました(別名帰属)。したがって、これらのチャットボットは間違いなく情報検索マシンであり、従来の検索エンジンと競合するか、または置き換えます。これらのモデルだけでなく、生成情報検索のより一般的な分野にもスペースを捧げたいと思います。 2つの主要なトピックでフィールドを暫定的に紹介します:接地された回答生成と生成ドキュメントの検索。また、生成的推奨、生成的な接地要約なども含めます。
Pull-Requests大歓迎!
決定論的な引用:ヘルスケアのためにLLMSをより安全にする
マット・ヨン
個人ブログ - 2024年4月[リンク]
検索拡張生成研究:2017-2024
Moritz Mallawitsch
スケーリング知識 - 2024年2月[リンク]
ぼろきれ:エンタープライズラグシステムをアーキテクトする方法
Pratik Bhavsar
ガリレオラボ - 2024年1月[リンク]
llamaindexを使用してローカルにMixtral 8x7を実行しています
llamaindex
Llamaindexブログ - 2023年12月[リンク]
高度なRAGテクニック:図解された概要
イヴァン・イリン
AIに向けて - 2023年12月[リンク]
LlamaindexとNeo4jを備えたマルチモーダルRAGパイプライン
トマズ・ブラタニック
Llamaindexブログ - 2023年12月[リンク]
テーブルのベンチマークラグ
ラングチェーン
Langchainブログ - 2023年12月[リンク]
Advanced Rag 01:小規模な検索
ソフィア・ヤン
データサイエンスに向けて - 2023年11月[リンク]
クエリ変換
ラングチェーン
Langchainブログ - 2023年10月[リンク]
ダイアログエージェントが役立つ理由は何ですか?
ナズニーン・ラジャニ、ネイサン・ランバート、ビクター・サン、トーマス・ウルフ
抱きしめるフェイスブログ - 2023年1月[リンク]
偽情報キャンペーンのための言語モデルの潜在的な誤用とリスクを減らす方法を予測する
ジョシュ・A・ゴールドスタイン、ギリッシュ・サストリー、ミカ・ムーザー、ルネ・ディレスタ、マシュー・ゲンツェル、カテリーナ・セドバ
Openaiブログ - 2023年1月[リンク]
事実、フェッチ、および理由:検索された生成世代の統一された評価Satyapriya Krishna、Kalpesh Krishna、Anhad Mohananey、Steven Schwarcz、Adam Stambler、Shyam Upadhyay、Manaal Faruqui Arxiv - SEP 2024 [Paper] [Paper]
Litsearch:科学文献検索のための検索ベンチマーク
Anirudh Ajith、Mengzhou Xia、Alexis Chevalier、Tanya Goyal、Danqi Chen、Tianyu Gao
arxiv - 2023年7月[紙] [データ]
明るい:推論集約型の検索のための現実的で挑戦的なベンチマーク
Hongjin SU、Howard Yen、Mengzhou Xia、Weijia Shi、Niklas Muennighoff、Han-Yu Wang、Haisu Liu、Quan Shi、Zachary S. Siegel、Michael Tang、Ruoxi Sun、Jinsung Yoon、Sercan O. Arik、Danqi Chen、Tao Yu Chen
arxiv - 2023年10月[紙] [データ] [コード]
flashllms:検索エンジンの拡張で大きな言語モデルをリフレッシュします
Tu Vu、Mohit Iyyer、Xuezhi Wang、Noah Constant、Jerry Wei、Jason Wei、Chris Tar、Yun-Hsuan Sung、Denny Zhou、Quoc Le、Thang Luong
arxiv - 2023年10月[紙] [コード]
LegalBench:大規模な言語モデルで法的推論を測定するための共同構築ベンチマーク
ニール・グハ、ジュリアン・ニャルコ、ダニエル・E・ホー、クリストファー・レ、アダム・チルトン、アディティア・ナラヤナ、アレックス・チョーラス・ウッド、オースティン・ピーターズ、ブランドン・ウォルドン、ダニエル・N・ロックモア、ディエゴ・ザンブラノ、ドミトリー・タリスマン、エナム・ホーク、ファイズ・ファーニ、ガリット・サルファイン・ハイガン、ガリット・サリア、ガリットポラト、ジェイソン・ヘグランド、ジェシカ・ウー、ジョー・ヌデル、ジョエル・ニクラウス、ジョン・ネイ、ジョナサン・H・チョイ、ケビン・トビア、マーガレット・ハガン、ミーガンMA、マイケル・リバモア、ニコン・ラスモフ・ラエ、ニルズ・ホルゼンベルガー、ニルス・ホルゼンバーガースペンサー・ウィリアムズ、サニー・ガンジー、トム・ズール、ヴァルン・アイアー、ゼフアリー
arxiv - 2023年8月[紙] [データセット]
オープンアシスタント会話 - 大規模な言語モデルのアライメントを民主化する
アンドレアス・ケップフ、ヤンニック・キルチャー、ディミトリ・フォン・リュッテ、ソティリス・アナグノスティディス、ジス・スティーブンス、キース・スティーブンス、アブドゥラ・バルフム、ヌグエン・ミン・ドゥック、オリバー・スタンレー、リチャルド・ナギーフィ、シャフル・ザ・アンドル・アンドルルー、アンドルルー、アンドルルー・アンドルルー、 Schuhmann、Huu Nguyen、Alexander Mattick
arxiv - 2023年4月[紙]
chatgpt-retrievalqa
Arian Askari、Mohammad Aliannejadi、Evangelos Kanoulas、Suzan verberne
Github - 2023年2月[コード]
Kamel:言語モデルのマルチトークンエンティティを使用した知識分析
Jan-Christoph Kalo、Leandra Fichtel
AKBC 22 - [紙]
Truthfulqa:モデルが人間の虚偽を模倣する方法を測定します
ステファニー・リン、ジェイコブ・ヒルトン、オウェイン・エヴァンス
arxiv - 2021年9月[紙] [コード]
複雑な回答検索
ローラ・ディーツ、マニシャ・ヴェルマ、フィリップ・ラドリンスキー、ニック・クラスウェル、ベン・ガマリ、ジェフ・ダルトン、ジョン・フォーリー
TREC - 2017-2019 [リンク]
GraphRag
ジョナサン・ラーソン、スティーブン・トルイット
マイクロソフト - 2024年2月[コード]
知識評価のギャップの狭窄:多粒度の回答でのオープンドメインの質問応答
ギャル・ヨナ、ロエ・アハロニ、モルゲバ
arxiv - 2024年1月[紙]
DHS LLMワークショップ - モジュール6
Sourab Mangrulkar
Github - 2023年12月[コード]
Primeqa:研究開発に答える最先端の多言語質問のためのプライムリポジトリ
Avirup Sil、Jaydeep Sen、Bhavani Iyer、Martin Franz、Kshitij Fadnis、Mihaela Bornea、Sara Rosenthal、Sara Rosenthal、Scott McCarley、Rong Zhang、Vishwajeet Kumar、Yulong Li、MD Arafat Sultan、Riyaz Bhat、Radu Florian、Salim、Salim、Salim
arxiv - 2023年1月[紙] [コード]
TRL:トランス補強学習
Leandro Von Werra、Younes Belkada、Lewis Tunstall、Edward Beeching、Tristan Thrush、Nathan Lambert、Shengyi Huang
Github - 2020 [コード]
FactScore:長い形式のテキスト生成における事実の精度の細かい原子評価
Sewon Min、Kalpesh Krishna、Xinxi Lyu、Mike Lewis、Wen-Tau Yih、Pang Wei Koh、Mohit Iyer、Luke Zettlemoyer、Hannaneh Hajishirzi
Pypi - 2023年5月[紙] [コード]
FACTKB:事実の知識で強化された言語モデルを使用した一般化可能な事実性評価
Shangbin Feng、Vidhisha Balachandran、Yuyang Bai、Yulia Tsvetkov
arxiv - 2023年5月[紙] [コード]
生成検索エンジンの検証可能性の評価
ネルソン・F・リュー、ティアニ・チャン、パーシー・リアン
arxiv - 2023年4月[紙] [コード]
推奨システムとパーソナライズのための生成AIに関するワークショップ
Narges Tabari、Aniket Deshmukh、Wang-Cheng Kang、Rashmi Gangadharaiah、Hamed Zamani、Julian McAuley、George Karypis
KDD 24 - 2024年8月[リンク]
生成情報検索に関する2番目のワークショップ
ガブリエル・ベネディクト、ルーチン・チャン、ドナルド・メッツラー、アンドリュー・イェーツ、Ziyan Jiang
Sigir 24 - 2024年7月[リンク]
パーソナライズされた生成AI
Zheng Chen、Ziyan Jiang、Fan Yang、Zhankui He、Yupeng Hou、Eunah Cho、Julian McAuley、Aram Galstyan、Xiaohua Hu、Jie Yang
CIKM 23 - 2023年10月[リンク]
生成モデルを使用した推奨事項に関する最初のワークショップ
Wenjie Wang、Yong Liu、Yang Zhang、Weiwen Liu、Fuli Feng、Xiangnan He、Aixin Sun
CIKM 23 - 2023年10月[リンク]
生成情報検索に関する最初のワークショップ
ガブリエル・ベネディクト、ルーチン・チャン、ドナルド・メッツラー
Sigir 23 - 2023年7月[リンク]
検索ベースの言語モデルとアプリケーション
Akari Asai、Sewon Min、Zexuan Zhong、Danqi Chen
ACL 23 - 2023年7月[リンク]
エージェント情報検索
ワイナン・チャン、ジュンウェイ・リアオ、ニン・リー、クニアンフア・デュ
arxiv - 2024年10月[紙]
暗唱、再構築、想起:多面的な現象としてのLMSでの暗記
USVSN Sai Prashanth、Alvin Deng、Kyle O'Brien、Jyothir SV、Mohammad Aflah Khan、Jaydeep Borkar、Christopher A. Chowett-Choo、Jacob Ray Fuehne、Stella Biderman、Tracy KE、Katherine Lee、Naomi Saphra
arxiv - 2024年6月[紙]
ChatGptはでたらめです
マイケル・タウンセン・ヒックス、ジェームズ・ハンフリーズ、ジョー・スレーター
Ethics Inf Technol - 2024年6月[紙]
マルチモーダルの大手言語モデルの幻覚:調査
Zechen Bai、Pichao Wang、Tianjun Xiao、Tong He、Zongbo Han、Zheng Zhang、Mike Zheng Shou
arxiv - 2024年4月[紙]
マッチングから世代へ:生成情報検索に関する調査
Xiaoxi Li、Jiajie Jin、Yujia Zhou、Yuyao Zhang、Peitian Zhang、Yutao Zhu、およびZhicheng Dou
arxiv - 2024年4月[紙]
LLMSの知識の矛盾:調査
Rongwu Xu、Zehan Qi、Cunxiang Wang、Hongru Wang、Yue Zhang、Wei Xu
arxiv - 2024年3月[紙]
Sigir 2023の生成情報検索(Gen-IR 2023)に関する第1回ワークショップに関するレポート
ガブリエル・ベネディクト、ルーチン・チャン、ドナルド・メッツラー、アンドリュー・イェーツ、ロマン・デファイエット、フィリップ・ヘイガー、サミ・ジュリエン
シギルフォーラム - 2023年12月[紙]
生成AIの時代にタスクに焦点を当てたIRに焦点を当てた第1ワークショップに関するレポート
Chirag Shah、Ryen W. White
シギルフォーラム - 2023年12月[紙]
生成的検索と推奨に向けて:Recsys2023の基調講演
Tat-Seng Chua
シギルフォーラム - 2023年12月[紙]
大規模な検索モデル:LLMSの時代の検索スタックの再定義
リアン・ワン、ナン・ヤン、Xiaolong Huang、Linjun Yang、Rangan Majumder、Furu Wei
シギルフォーラム - 2023年12月[紙]
生成情報抽出のための大規模な言語モデル:調査
Derong Xu、Wei Chen、Wenjun Peng、Chao Zhang、Tong Xu、Xiangyu Zhao、Xian Wu、Yefeng Zheng、Enhong Chen
arxiv - 2023年12月[紙]
事前処理された言語モデルに基づく密なテキスト検索:調査
ウェイン・シン・ザオ、ジン・リュー、ルイヤン・レン、ジ・ロング・ウェン
TOIS - 2023年12月[紙]
大規模な言語モデルの検索された生成:調査
ユンファン・ガオ、ユン・シオン、シニュー・ガオ、カングクシアン・ジア、ジンリウ・パン、Yuxi Bi、Yi Dai、Jiawei Sun、Haofen Wang
arxiv - 2023年12月[紙]
キャリブレーションされた言語モデルは幻覚する必要があります
アダム・タウマン・カライ、サントシュ・S・ヴェンパラ
arxiv - 2023年11月[紙]
AI OceanでのSirenの歌:大規模な言語モデルでの幻覚に関する調査
Yue Zhang、Yafu Li、Leyang Cui、Deng Cai、Lemao Liu、Tingchen Fu、Xinting Huang、Enbo Zhao、Yu Zhang、Yulong Chen、Longyue Wang、Anh Tuan Luu、Wei Bi、Freda Shi
arxiv - 2023年9月[紙]
独自のLLMを模倣するという誤った約束
Arnav Gudibande、Eric Wallace、Charlie Snell、Xinyang Geng、Hao Liu、Pieter Abbeel、Sergey Levine、Dawn Song
arxiv - 2023年5月[紙]
生成的推奨:次世代の推奨パラダイムに向けて
Fengji Zhang、Bei Chen、Yue Zhang、Jin Liu、Daoguang Zan、Yi Mao、Jian-Guang Lou、Weizhu Chen
arxiv - 2023年4月[紙]
拡張言語モデル:調査
グレゴワール・ミアロン、ロベルト・デスシサ、マリア・ロメリ、クリストフォロス・ナルパンティス、ラム・パスヌル、ロベルタ・レールアン、バプティスト・ロジエール、ティモ・シック、ジェーン・ドワイヴィー・ユ、アスリ・セリキルマズ、エドゥアード・グレイブ、ヤン・レコン、トーマス・シェアマイアミア科
arxiv - 2023年2月[紙]
生成言語モデルと自動化された影響操作:新たな脅威と潜在的な緩和
ジョシュ・A・ゴールドスタイン、ギリッシュ・サストリー、ミカ・ムーザー、レニー・ディレスタ、マシュー・ゲンツェル、カテリーナ・セドバ
arxiv - 2023年1月[紙]
会話情報探索。会話の検索、推奨、質問への回答の紹介
ハメド・ザマニ、ヨハンヌ・R・トリッパス、ジェフ・ダルトン、フィリップ・ラドリンスキー
arxiv - 2023年1月[紙]
事実
ケビン・マリガンとファブリス・コレイア
スタンフォード哲学百科事典 - 2021年冬[URL]
真実のAI:嘘をつかないAIの開発と統治
Owain Evans、Owen Cotton-Barratt、Lukas Finnveden、Adam Bales、Avital Balwit、Peter Wills、Luca Righetti、William Saunders
arxiv - 2021年10月[紙]
検索の再考:Dilettantesからドメインの専門家を作る
ドナルド・メッツラー、Yi Tay、Dara Bahri、Marc Najork
Sigir Forum 2021 - 5月2021年[論文]
帰属質問の回答:属性の大規模な言語モデルの評価とモデリング
Bernd Bohnet、Vinh Q. Tran、Pat Verga、Roee Aharoni、Daniel Andor、Livio Baldini Soares、Jacob Eisenstein、Kuzman Ganchev、Jonathan Herzig、Kai Hui、Tom Kwiatkowski、Ji Maドナルド・メッツラー、スラブ・ペトロフ、ケリー・ウェブスター
arxiv - 2022年12月[紙]
推論時に外部接地/検索
Raptor:樹木が組織化された検索のための再帰的抽象的処理
Parth Sarthi、Salman Abdullah、Aditi Tuli、Shubh Khanna、Anna Goldie、Christopher D. Manning
ICLR 24 - 2024年1月[紙]
矯正検索拡張生成
shi-qi yan、jia-chen gu、yun zhu、zhen-hua ling
arxiv - 2024年1月[紙]
それは時間です:検索拡張言語モデルに一時性を組み込む
Anoushka Gade、Jorjeta Jecheva
arxiv - 2024年1月[紙]
Rag vs微調整:パイプライン、トレードオフ、および農業に関するケーススタディ
エンジェルス・バラガー、ヴィナムラ・ベナラ、レナート・ルイス・デ・フレイタス・クーニャ、ロベルト・デ・M・エステヴァン・フィーホ、トッド・ヘンドリー、ダニエル・ホルスタイン、ジェニファー・マースマン、ニック・メクレンブルク、サラ・マルバー、レオナルド・O・ヌーンズ、ラファエル・パダイハー、ランファエル・シェアマ、スワ・ヴィージー・シルバ、チャンドラ
arxiv - 2024年1月[紙]
シーケンスma.ters:会話エージェントを構築するための生成されたレトリエイブジェネレーションモデル
Quinn Patwardhan、Grace Hui Yang
Trec 23 - 2023年11月[紙]
自己狂気:自己反省を通じて検索、生成、批評を学ぶ
匿名
ICLR 24 - 2023年10月[紙]
RA-DIT:検索された二重命令チューニング
匿名
ICLR 24 - 2023年10月[紙]
検索拡張エンコーダーデコーダー言語モデルを使用したコンテキスト内学習
匿名
ICLR 24 - 2023年10月[紙]
検索された文字モデルを無関係なコンテキストに堅牢にします
匿名
ICLR 24 - 2023年10月[紙]
検索は、長いコンテキストの大きな言語モデルを満たします
匿名
ICLR 24 - 2023年10月[紙]
適応策としての大規模な言語モデルのドメイン適応を再編成します
匿名
ICLR 24 - 2023年10月[紙]
Instructretro:取得後の整理式前orainingの命令チューニング
匿名
ICLR 24 - 2023年10月[紙]
確かに:要約された検索によるLLMSのオープンドメインの質問回答の改善
匿名
ICLR 24 - 2023年10月[紙]
再承認:コンテキストの圧縮と選択的増強により、検索の高度LMSの改善
匿名
ICLR 24 - 2023年10月[紙]
検索は正確な生成です
匿名
ICLR 24 - 2023年10月[紙]
Paperqa:科学研究のための検索された生成エージェント
匿名
ICLR 24 - 2023年10月[紙]
長い形式の質問回答のための検索の増強を理解する
匿名
ICLR 24 - 2023年10月[紙]
ベイジアンメトリック拡張検索を介したパーソナライズされた言語生成
匿名
ICLR 24 - 2023年10月[紙]
DSPY:宣言言語モデルの呼び出しを自己改善パイプラインにコンパイルします
オマール・ハッタブ、アルナブ・シンヴィ、パリディ・マヘシュワリ、Zhiyuan Zhang、Keshav Santhanam、Sri Vardhamanan、Saiful Haq、Ashutosh Sharma、Thomas T. Joshi、Hanna Moazam、Heather Miller、Matei Zaharia、Christopher Potts
arxiv - 2023年10月[紙] [コード]
RA-DIT:検索された二重命令チューニング
Xi Victoria Lin、Xilun Chen、Mingda Chen、Weijia Shi、Maria Lomeli、Rich James、Pedro Rodriguez、Jacob Kahn、Gergely Szilvasy、Mike Lewis、Luke Zettlemoyer、Scott Yih
arxiv - 2023年8月[紙]
ツールドキュメントにより、大きな言語モデルを備えたゼロショットツール使用が可能になります
Cheng-Yu Hsieh、Si-An Chen、Chun-Liang Li、Yasuhisa Fujii、Alexander Ratner、Chen-Yu Lee、Ranjay Krishna、Tomas Pfister
arxiv - 2023年8月[紙]
ReaUGKD:事前に訓練された言語モデルの検索された知識蒸留
Jianyi Zhang、Aashiq Muhamed、Aditya Anantharaman、Guoyin Wang、Changyou Chen、Kai Zhong、Qingjun Cui、Yi Xu、Belinda Zeng、Trishul Chilimbi、Yiran Chen
ACL 23 - 2023年7月[紙]
表面ベースの検索は、検索された語学モデルの困惑を軽減します
Ehsan Doostmohammadi、Tobias Norlund、Marco Kuhlmann、Richard Johansson
ACL 23 - 2023年7月[紙]
大規模な言語モデルで密な検索を強化するためのソフトプロンプトチューニング
Zhiyuan Peng、Xuyang Wu、Yi Fang
arxiv - 2023年6月[紙]
reta-llm:検索された大規模な言語モデルツールキット
Jiongnan Liu、Jiajie Jin、Zihan Wang、Jiehan Cheng、Zhicheng Dou、Ji-Rong Wen
arxiv - 2023年6月[紙]
Webglm:人間の好みを備えた効率的なWeb強化質問留保システムに向けて
Xiao Liu、Hanyu Lai、Hao Yu、Yifan Xu、Aohan Zeng、Zhengxiao Du、Peng Zhang、Yuxiao Dong、Jie Tang
arxiv - 2023年6月[紙]
Wikichat:ウィキペディアでのいくつかのショットの接地によって大きな言語モデルチャットボットの幻覚を止める
Sina J. Semnani、Violet Z. Yao、Heidi C. Zhang、Monica S. Lam
EMNLP調査結果2023 - 2023年5月[紙] [コード] [デモ]
RET-LLM:大規模な言語モデルの一般的な読み取りろう記憶に向けて
Ali Modarressi、Ayyoob Imani、Mohsen Fayyaz、Hinrich Schutze
arxiv - 2023年5月[紙]
Gorilla:大規模なAPIに接続された大きな言語モデル
Shishir G. Patil、Tianjun Zhang、Xin Wang、Joseph E. Gonzalez
arxiv - 2023年5月[紙] [コード]
検索して自動脱着言語モデルを前にしましょうか?包括的な研究
Boxin Wang、Wei Ping、Peng Xu、Lawrence McAfee、Zihan Liu、Mohammad Shoeybi、Yi Dong、Oleksii Kuchaiev、Bo Li、Chaowei Xiao、Anima Anandkumar、Bryan Catanzaro
arxiv - 2023年4月[紙] [コード]
あなたの事実を確認してもう一度やり直してください:外部の知識と自動化されたフィードバックで大規模な言語モデルを改善する
Baolin Peng、Michel Galley、Pengcheng He、Hao Cheng、Yujia Xie、Yu Hu、Qiuyuan Huang、Lars Liden、Zhou Yu、Weizhu Chen、Jianfeng Gao
arxiv - 2023年2月[紙] [コード]
ツールフォーマー:言語モデルは、ツールを使用するように自分自身を教えることができます
ティモ・シック、ジェーン・ドワイヴィーティ・ユ、ロベルト・デスシュ、ロベルタ・レイレアン、マリア・ロメリ、ルーク・ゼトルモイヤー、ニコラ・カンセドダ、トーマス・スシアム
arxiv - 2023年2月[紙]
再現:検索されたブラックボックス言語モデル
Weijia Shi、Sewon Min、Michihiro Yasunaga、Minjoon Seo、Rich James、Mike Lewis、Luke Zettlemoyer、Wen-Tau Yih
arxiv - 2023年1月[紙]
コンテキスト内検索言語モデル
Ori Ram、Yoav Levine、Itay Dalmedigos、Dor Muhlgay、Amnon Shashua、Kevin Leyton-Brown、Yoav Shham
AI21 Labs - 2023年1月[Paper] [Code]
オープンドメインチャットボットを構築するためのレシピ
スティーブン・ローラー、エミリー・ディナン、ナマン・ゴヤル、ダ・ジュ、メアリー・ウィリアムソン、イーニャン・リュー、ジン・XU、マイル・オット、エリック・マイケル・スミス、Y-Lan Bouroe、ジェイソン・ウェストン
EACL 2021 - 2021年4月[論文]
ATMAN:メモリ効率的な注意操作を通じてトランスの予測を理解する
ハメド・ザマニ、ヨハンヌ・R・トリッパス、ジェフ・ダルトン、フィリップ・ラドリンスキー
arxiv - 2023年1月[紙]
Retromae V2:トレーニング前の検索指向言語モデル用の二重マスク自動エンコーダー
シタオ・シャオ、Zheng Liu
arxiv - 2023年11月[紙]
実証済みの検査:知識集約型NLP Omar Khattabの検索モデルと言語モデルの作成
arxiv - 2022年12月[紙]
数兆個のトークンから取得することにより、言語モデルを改善します
セバスチャン・ボルジャウド、アーサー・メンシュ、ジョーダン・ホフマン、トレヴァー・カイ、エリザ・ラザフォード、ケイティ・ミリカン、ジョージ・ヴァン・デン・ドリスシェ、ジャン・バプティスト・レスピアウ、ボグダン・ダモック、エイダン・クラーク、ディエゴ・デ・ラス・カサス、アウレリアガイ、ジャコブ・メニック、ロマン・リビング、ザ・ロマン・リング、ローレン・マギオーレ、クリス・ジョーンズ、アルビン・キャシラー、アンディ・ブロック、ミケラ・パガニーニ、ジェフリー・アーヴィング、オリオール・ヴィンヴィヴァルズ、サイモン・オシンデロ、カレン・シモーニャン、ジャック・W・レイ、エーリッヒ・エルセン、ローレント・シフレ
arxiv - 2022年2月[紙]
数兆個のトークンから取得することにより、言語モデルを改善します
セバスチャン・ボルジャウド、アーサー・メンシュ、ジョーダン・ホフマン、トレヴァー・カイ、エリザ・ラザフォード、ケイティ・ミリカン、ジョージ・ヴァン・デン・ドリスシェ、ジャン・バプティスト・レスピアウ、ボグダン・ダモック、エイダン・クラーク、ディエゴ・デ・ラス・カサス、アウレリアガイ、ジャコブ・メニック、ロマン・リビング、ザ・ロマン・リング、ローレン・マッジョーレ、クリス・ジョーンズ、アルビン・キャシラー、アンディ・ブロック、ミケラ・パガニーニ、ジェフリー・アーヴィング、オリオール・ヴィニャルズ、サイモン・オシンデロ、カレン・シモーニャン、ジャック・W・レイ、エーリッヒ・エルセン、ローレント・シフレ
arxiv - 2021年12月[紙]
WebGPT:人間のフィードバックを使用したブラウザ支援の質問
レイチーロ・ナカノ、ジェイコブ・ヒルトン、オシル・バラジ、ジェフ・ウー、ロング・オウヤン、クリスティーナ・キム、クリストファー・ヘッセ、シャンタヌ・ジャイン、ヴィネット・コサラジュ、ウィリアム・サンダース、Xu江、カール・コブ、ティナ・エロウンド、グレッチェン・クルーガー、ケビン・ボタン、ベナイ、マタ
arxiv - 2021年12月[紙]
bert-knn:より良いQAのために、KNN検索コンポーネントを前処理された言語モデルに追加する
ノラ・カスナー、ヒンリッヒ・シュッツェ
EMNLP 2020 - 2020年11月[紙]
レルム:検索された言語モデルのトレーニング前
Kelvin Guu、Kenton Lee、Zora Tung、Panupong Pasupat、Ming-Wei Chang
ICML 2020 - 2020年7月[紙]
ハイブリッド検索世代のニューラル会話モデル
Liu Yang、Junjie Hu、Minghui Qiu、Chen QU、Jianfeng Gao、W。BruceCroft、Xiaodong Liu、Yelong Shen、Jingjing Liu
arxiv - 2019年4月[紙]
推論時に内部モデルの重みに接地されています
大規模な言語モデルは、事前トレーニング中にどのように事実の知識を獲得しますか?
Hoyeon Chang、Jinho Park、Seonghyeon Ye、Sohee Yang、Youngkyung Seo、Du-Seong Chang、Minjoon Seo
arxiv - 2024年6月[紙]
事実性のための微調整言語モデル
キャサリン・ティアン、エリック・ミッチェル、フアキウ・ヤオ、クリストファー・D・マニング、チェルシー・フィン
arxiv - 2023年11月[紙]
R-Tuning:不明な質問を拒否するために大規模な言語モデルを教える
ハニング・チャン、シジェ・ディアオ、ヨン・リン、YI R. Fung、Qing Lian、Xingyao Wang、Yangyi Chen、Heng Ji、Tong Zhang
arxiv - 2023年11月[紙]
EasyEdit:大規模な言語モデル向けの使いやすい知識編集フレームワーク
ペン・ワン、ニンジ・チャン、シン・シー、ユンジ・ヤオ、ボゾン・ティアン、メングル・ワン、ゼクンXI、シュユアン・チェン、カンウェイ・リュー、輝ou Zheng、フアジュン・チェン
arxiv - 2023年8月[紙]
言語モデルの知識表現の検査と編集
エヴァン・ヘルナンデス、ベリンダ・Z・リー、ジェイコブ・アンドレアス
arxiv - 2023年4月[紙] [コード]
オープンドメインの質問応答の生成モデルを使用したパッセージ検索を活用する
Gautier Izacard、Edouard Grave
arxiv - 2023年2月[紙]
監督なしで言語モデルの潜在的な知識を発見します
コリン・バーンズ、ハオチアン・イェ、ダン・クライン、ジェイコブ・スタインハルト
ICLR 23 - 2023年2月[紙] [コード]
Galactica:科学の大規模な言語モデル
ロス・テイラー、マーシン・カルダス、ギレム・ククルル、トーマス・スシアム、アンソニー・ハートショーン、エルビス・サラビア、アンドリュー・ポールトン、ヴィクトル・カーケス、ロバート・ストジニック
Galactica.org - 2022 [紙]
BlenderBot 3:責任を持って関与することを継続的に学習する展開された会話エージェント
Kurt Shuster、Jing Xu、Mojtaba Komeili、Da Ju、Eric Michael Smith、Stephen Roller、Megan Ung、Moya Chen、Kushal Arora、Joshua Lane、Morteza Behrooz、William Ngan、Spencer Poff、Naman Goyal、Arthur SzAl
arxiv - 2022年8月[紙]
取得するのではなく生成:大規模な言語モデルは強力なコンテキストジェネレーターです
Wenhao Yu、Dan Iter、Shuohang Wang、Yichong Xu、Mingxuan JU、Soumya Sanyal、Chenguang Zhu、Michael Zeng、Meng Jiang
ICLR 2023 - 2022年9月[紙]
朗読言語モデル
Zhiqing Sun、Xuezhi Wang、Yi Tay、Yiming Yang、Denny Zhou
ICLR 2023 - 2022年9月[紙]
ターゲットを絞った人間の判断を介して、対話エージェントの調整を改善します
アメリア・グレース、ナット・マカレーズ、マジャ・トルバッツ、ジョン・アスラニデス、ヴラド・フィロイ、ティモ・エウォルド、マリベス・ラウ、ローラ・ウェイディンダー、マーティン・チャドウィック、フィービー・サッカー、ルーシー・キャンベル・ギリンガム、ジョナサン・ウーサート、ポサン・アバンシュ、ファン・アバナ族、ヤンガン・アバナ族、ロリー・グレイグ、チャーリー・チェン、ダグ・フリッツ、ジャーム・サンチェス・エリアス、リチャード・グリーン、ソア・モクラ、ニコラス・フェルナンド、ボクシー・ウー、レイチェル・フォーリー、スザンナ・ヤング、イーソン・ガブリエル、ウィリアム・アイザック、ジョン・メラー、デミス・アナブス、リサビスアーヴィング
arxiv - 2022年9月[紙]
Lamda:ダイアログアプリケーションの言語モデル
ロマル・トッピラン、ダニエル・デ・フレイタス、ジェイミー・ホール、ノーム・シャジャー、アポールヴ・クルシュレシュタ、ヘン・ツェン、アリシア・ジン、テイラー・ボス、レスリー・ベイカー、ユ・デュ、ヤグアン・リー、ホンレイ・リー、フアイシウ・スティーブン・ザン、アミン・グフィーリ、ハイーリ、マシュフリ・ムーリ、ハンギKrikun、Dmitry Lepikhin、James Qin、Dehao Chen、Yuanzhong Xu、Zhifeng Chen、Adam Roberts、Maarten Bosma、Vincent Zhao、Yanqi Zhou、Chung-Ching Chang、Igor Krivokon、Will Rusch、Marc Pickett、PranesheSresh Srinivee Man、keriniveasan、kerinivasan、 Meier-Hellstern、Meredith Ringel Morris、Tulsee Doshi、Renelito Delos Santos、Toju Duke、Johnny Soraker、Ben Zevenbergen、Vinodkumar Prabhakaran、Mark Diaz、Ben Hutchinson、Kristen Olson、Alejandra Molina Rajakumar、Alena Butryna、Matthew Lamm、Viktoriya Kuzmina、Joe Fenton、Aaron Cohen、Rachel Bernstein、Ray Kurzweil、Blaise Aguera-Arcas、Claire Cui、Marian Croak、Ed Chi、Quoc Le
arxiv - 2022年1月[紙]
知識ベースとしての言語モデル
サイモン・ラズニエフスキー、アンドリュー・イェーツ、ノラ・カスナー、ゲルハルト・ワイクム
DL4KG 2021 - 10月2021年[紙]
暗記による一般化:最近隣接言語モデル
Urvashi Khandelwal、Omer Levy、Dan Jurafsky、Luke Zettlemoyer、Mike Lewis
ICLR 2020 - 2019年9月[紙] [コード]
ChatGptは検索が得意ですか?再ランキングエージェントとしての大規模な言語モデルを調査します
Wenhao Yu、Hongming Zhang、Xiaoman Pan、Kaixin MA、Hongwei Wang、Dong Yu
arxiv - 2023年11月[紙]
命令の蒸留により、大規模な言語モデルは効率的なゼロショットランカーになります
Weiwei Sun、Zheng Chen、Xinyu MA、Lingyong Yan、Shuaiqiang Wang、Pengjie Ren、Zhumin Chen、Dawei Yin、Zhaochun Ren
ARXIV 2023 - 2023年11月[紙]
批評家:大規模な言語モデルは、ツール相性的な批評で自己修正できます
Zibin Gou、Zhihong Shao、Yeyun Gong、Yelong Shen、Yujiu Yang、Nan Duan、Weizhu Chen
ICLR 2024 - 2024年1月[紙]
時間のステッチは9を節約します:低信頼性の生成を検証することにより、LLMの幻覚を検出して軽減する
Neeraj Varshney、Wenlin Yao、Hongming Zhang、Jianshu Chen、Dong Yu
arxiv - 2023年8月[紙]
RARR:言語モデルを使用して、言語モデルが言うことの調査と修正
Luyu Gao、Zhuyun Dai、Panupong Pasupat、Anthony Chen、Arun Tejasvi Chaganty、Yicheng Fan、Vincent Zhao、Ni Lao、Hongrae Lee、Da-Cheng Juan、Kelvin Guuu
ACL 2023 - 2023年7月[紙]
Verify-and-Edit:知識が強化されたチェーンの枠組み
Ruochen Zhao、Xingxuan Li、Shafiq Joty、Chengwei Qin、Lidong Bing
ACL 2023 - 2023年7月[紙]
アクティブ検索拡張生成
Zhengbao Jiang、Frank F. Xu、Luyu Gao、Zhiqing Sun、Qian Liu、Jane Dwivedi-Yu、Yiming Yang、Jamie Callan、Graham Neubig
arxiv - 2023年5月[紙] [コード]
プラグアンドプレイの検索フィードバックによる言語モデルの改善
Wenhao Yu、Zhihan Zhang、Zhenwen Liang、Meng Jiang、Ashish Sabharwal
arxiv - 2023年5月[紙]
長型世代の言語キャリブレーション
ニール・バンド、Xuechen Li、Tengyu MA、Tatsunori hashimoto
Arxiv 2024 - 2024年6月[紙]
あなたのLLMを信じるかどうかを信じるかどうか
Yasin Abbasi Yadkori、Ilja Kuzborskij、AndrásGyörgy、CsabaSzepesvári
Arxiv 2024 - 2024年6月[紙]
Sayself:自己反映の理論的根拠に自信を表明するようにLLMを教える
Tianyang Xu、Shujin Wu、Shizhe Diao、Xiaoze Liu、Xingyao Wang、Yangyi Chen、Jing Gao
Arxiv 2024 - 2024年5月[紙]
専門家はチートしない:ペアを予測することによってあなたが知らないことを学ぶ
ダニエル・D・ジョンソン、ダニエル・ターロー、デビッド・デュヴェン、クリス・J・マディソン
Arxiv 2024 - 2024年2月[紙]
予想テキスト生成のロック解除:大規模な言語モデルで忠実なデコードのための制約されたアプローチ
匿名
ICLR 24 - 2023年10月[紙]
DOLA:対照的な層でデコードすると、大規模な言語モデルの事実性が向上します
Yung-Sung Chuang、Yujia Xie、Hongyin Luo、Yoon Kim、James Glass、Pengcheng He
ICLR 24 - 2023年9月[紙]
大規模な言語モデルで忠実で高品質の患者の要約を生成するためのデータ中心のアプローチ
Stefan Hegselmann、Shannon Zejiang Shen、Florian Gierse、Monica Agrawal、David Sontag、Xiaoyi Jiang
Arxiv 24 - 2024年2月[紙]
確率的ラグ:予想されるユーティリティの最大化を通じて、エンドツーエンドの検索の頂点生成
ハメド・ザマニ、マイケル・ベンダースキー
Arxiv 24 - 2024年5月[紙]
憲法AI:AIフィードバックからの無害
Yuntao Bai、Saurav Kadavath、Sandipan Kundu、Amanda Adkell、Jackson Kernion、Andy Jones、Anna Chen、Anna Goldie、Azalia Mirhoseini、Cameron McKinnon、Carol Chen、Catherine Olsson、Christopher Olah、Danny Hernandez、Dawn Drain、Deep Gandanペレス、ジェイミー・カー、ジャレッド・ミューラー、ジェフリー・ラディッシュ、ジョシュア・ランダウ、カマル・ヌドゥーセ、カミール・ルコシュート、リアン・ロビット、マイケル・セリット、ネルソン・エルハージ、ニコラス・シーファー、ノエミ・メルカド、ノヴァ・ダッサルマ、ロバート・ラーソン、ロビン・ラーソン、 Sheer El Showk、Stanislav Fort、Tamera Lanham、Timothy Telleen-Lawton、Tom Conerly、Tom Henighan、Tristan Hume、Samuel R. Bowman、Zac Hatfield-Dodds、Ben Mann、Dario Amodei、Nicholas Joseph、Sam McCandlish、Tom Brown、Jare
展開後に新しいスキルを学ぶ:オープンドメインのインターネット駆動型の対話の改善人間のフィードバック
Jing Xu、Megan Ung、Mojtaba Komeili、Kushal Arora、Y-Lan Boureau、Jason Weston
arxiv - 2022年8月[紙]
検索されたマルチモーダル言語モデリング
Yasunaga、Armen Aghajanyan、Weijia Shi、Rich James、Jure Leskovec、Percy Liang、Mike Lewis、Luke Zettlemoyer、Wen-Tau Yih
arxiv - 2022年11月[紙]
RAMM:Multi-Modal Pre-Trainingによる回収された生物医学的視覚的質問の回答
Zheng Yuan、Qiao Jin、Chuanqi Tan、Zhengyun Zhao、Hongyi Yuan、Fei Huang、Songfang Huang
arxiv - 2023年3月[紙]
知識集約型のマルチステップの質問のための考え方の推論を備えたインターリーブ検索過酷なTrivedi、Niranjan Balasubramanian、Tushar Khot、Ashish Sabharwal ACL 23 - 2023年7月[Paper]
React:言語モデルでの相乗効果と行動
Shunyu Yao、Jeffrey Zhao、Dian Yu、Nan Du、Izhak Shafran、Karthik Narasimhan、Yuan Cao
arxiv - 2022年10月[紙]
リポコーダー:反復検索と生成によるリポジトリレベルのコード完了
Fengji Zhang、Bei Chen、Yue Zhang、Jin Liu、Daoguang Zan、Yi Mao、Jian-Guang Lou、Weizhu Chen
arxiv - 2023年3月[紙]
docprompting:ドキュメントを取得してコードを生成します
Shuyan Zhou、Uri Alon、Frank F. Xu、Zhiruo Wang、Zhengbao Jiang、Graham Neubig
ICLR 23 - 2022年7月[紙] [コード] [データ]
生成、フィルター、ヒューズ:ゼロショットニューラルランカーのマルチステップキーワード生成によるクエリ拡張
Minghan Li、Honglei Zhuang、Kai Hui、Zhen Qin、Jimmy Lin、Rolf Jagerman、Xuanhui Wang、Michael Bendersky
arxiv - 2023年11月[紙]
agent4ranking:マルチエージェントLLMを使用したパーソナライズされたクエリの書き換えによるセマンティックロバストランキング
Xiaopeng Li、Lixin SU、Pengyue Jia、Xiangyu Zhao、Suqi Cheng、Junfeng Wang、Dawei Yin
arxiv - 2023年12月[紙]
スポンサー付き検索での書き換えのための統合生成および密な検索
Akash Kumar Mohankumar、Bhargav Dodla、Gururaj K、Amit Singh
arxiv - 2022年9月[紙]
事実上一貫したスポーツを生成するナレーションはナレーションを強調します
ノア・サルファティ、アイド・イェルシャルミー、マイケル・チェルトック、ヨシ・ケラー
MMSPORTS 2023 - 10月23日[紙]
遺伝的生成情報検索
Hrishikesh Kulkarni、Zachary Young、Nazli Goharian、Ophir Frieder、Sean Macavaney
Doceng 23 - 8月23日[論文]
人間のフィードバックで要約することを学ぶ
Nisan Stiennon、Long Ouyang、Jeff Wu、Daniel M. Ziegler、Ryan Lowe、Chelsea Voss、Alec Radford、Dario Amodei、Paul Christiano
Neurips 2020 - 2020年9月[紙]
On Faithfulness and Factuality in Abstractive Summarization
Joshua Maynez, Shashi Narayan, Bernd Bohnet, Ryan McDonald
ACL 2020 – May 2020 [paper]
Augment before You Try: Knowledge-Enhanced Table Question Answering via Table Expansion
Yujian Liu, Jiabao Ji, Tong Yu, Ryan Rossi, Sungchul Kim, Handong Zhao, Ritwik Sinha, Yang Zhang, Shiyu Chang
arXiv – Jan 2024 [paper]
We jump-started this section by reusing the content of awesome-generative-retrieval-models and give full credit to Chriskuei for that! We now have added some content on top.
De-DSI: Decentralised Differentiable Search Index
Petru Neague, Marcel Gregoriadis, Johan Pouwelse
EuroMLSys 24 – Apr 2024 [paper]
Listwise Generative Retrieval Models via a Sequential Learning Process
Yubao Tang, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Wei Chen, Xueqi Cheng
TOIS 2024 – Mar 2024 [Paper]
Distillation Enhanced Generative Retrieval
Yongqi Li, Zhen Zhang, Wenjie Wang, Liqiang Nie, Wenjie Li, Tat-Seng Chua
arXiv 2024 – Feb 2024 [Paper]
Self-Retrieval: Building an Information Retrieval System with One Large Language Model
Qiaoyu Tang, Jiawei Chen, Bowen Yu, Yaojie Lu, Cheng Fu, Haiyang Yu, Hongyu Lin, Fei Huang, Ben He, Xianpei Han, Le Sun, Yongbin Li
arXiv 2024 – Feb 2024 [Paper]
Generative Dense Retrieval: Memory Can Be a Burden
Peiwen Yuan, Xinglin Wang, Shaoxiong Feng, Boyuan Pan, Yiwei Li, Heda Wang, Xupeng Miao, Kan Li
EACL 2024 - Jan 2024 [paper] [code]
Auto Search Indexer for End-to-End Document Retrieval
Tianchi Yang, Minghui Song, Zihan Zhang, Haizhen Huang, Weiwei Deng, Feng Sun, Qi Zhang
EMNLP 2023 - December 23 [paper]
DiffusionRet: Diffusion-Enhanced Generative Retriever using Constrained Decoding
Shanbao Qiao, Xuebing Liu, Seung-Hoon Na
EMNLP Findings 2023 – Dec 2023 [paper]
Scalable and Effective Generative Information Retrieval
Hansi Zeng, Chen Luo, Bowen Jin, Sheikh Muhammad Sarwar, Tianxin Wei, Hamed Zamani
WWW 2024 - Nov 2023 [paper] [code]
Nonparametric Decoding for Generative Retrieval
Hyunji Lee, JaeYoung Kim, Hoyeon Chang, Hanseok Oh, Sohee Yang, Vladimir Karpukhin, Yi Lu, Minjoon Seo
ACL Findings 2023 – Jul 2023 [paper]
Model-enhanced Vector Index
Hailin Zhang, Yujing Wang, Qi Chen, Ruiheng Chang, Ting Zhang, Ziming Miao, Yingyan Hou, Yang Ding, Xupeng Miao, Haonan Wang, Bochen Pang, Yuefeng Zhan, Hao Sun, Weiwei Deng, Qi Zhang, Fan Yang, Xing Xie, Mao Yang, Bin Cui
NeurIPS 2023 – May 2023 [paper] [code]
Continual Learning for Generative Retrieval over Dynamic Corpora
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Wei Chen, Yixing Fan, Xueqi Cheng
CIKM 2023 - Aug 2023 [paper]
Learning to Rank in Generative Retrieval
Yongqi Li, Nan Yang, Liang Wang, Furu Wei, Wenjie Li
arXiv – Jun 2023 [paper]
Large Language Models are Built-in Autoregressive Search Engines
Noah Ziems, Wenhao Yu, Zhihan Zhang, Meng Jiang
ACL Findings 2023 – May 2023 [paper]
Multiview Identifiers Enhanced Generative Retrieval
Yongqi Li, Nan Yang, Liang Wang, Furu Wei, Wenjie Li
ACL 2023 – May 2023 [paper]
How Does Generative Retrieval Scale to Millions of Passages?
Ronak Pradeep, Kai Hui, Jai Gupta, Adam D. Lelkes, Honglei Zhuang, Jimmy Lin, Donald Metzler, Vinh Q. Tran
arXiv – May 2023 [paper]
TOME: A Two-stage Approach for Model-based Retrieval
Ruiyang Ren, Wayne Xin Zhao, Jing Liu, Hua Wu, Ji-Rong Wen, Haifeng Wang
ACL 2023 - May 2023 [paper]
Understanding Differential Search Index for Text Retrieval
Xiaoyang Chen, Yanjiang Liu, Ben He, Le Sun, Yingfei Sun
ACL Findings 2023 - May 2023 [paper]
Learning to Tokenize for Generative Retrieval
Weiwei Sun, Lingyong Yan, Zheng Chen, Shuaiqiang Wang, Haichao Zhu, Pengjie Ren, Zhumin Chen, Dawei Yin, Maarten de Rijke, Zhaochun Ren
arXiv – Apr 2023 [paper]
DynamicRetriever: A Pre-trained Model-based IR System Without an Explicit Index
Yu-Jia Zhou, Jing Yao, Zhi-Cheng Dou, Ledell Wu, Ji-Rong Wen
Machine Intelligence Research – Jan 2023 [paper]
DSI++: Updating Transformer Memory with New Documents
Sanket Vaibhav Mehta, Jai Gupta, Yi Tay, Mostafa Dehghani, Vinh Q. Tran, Jinfeng Rao, Marc Najork, Emma Strubell, Donald Metzler
arXiv – Dec 2022 [paper]
CodeDSI: Differentiable Code Search
Usama Nadeem, Noah Ziems, Shaoen Wu
arXiv – Oct 2022 [paper]
Contextualized Generative Retrieval
Hyunji Lee, Jaeyoung Kim, Hoyeon Chang, Hanseok Oh, Sohee Yang, Vlad Karpukhin, Yi Lu, Minjoon Seo
arXiv – Oct 2022 [paper]
Transformer Memory as a Differentiable Search Index
Yi Tay, Vinh Q. Tran, Mostafa Dehghani, Jianmo Ni, Dara Bahri, Harsh Mehta, Zhen Qin, Kai Hui, Zhe Zhao, Jai Gupta, Tal Schuster, William W. Cohen, Donald Metzler
Neurips 2022 – Oct 2022 [paper] [Video] [third-party code]
A Neural Corpus Indexer for Document Retrieval
Wang et al。
Arxiv 2022 [paper]
Bridging the Gap Between Indexing and Retrieval for Differentiable Search Index with Query Generation
Shengyao Zhuang, Houxing Ren, Linjun Shou, Jian Pei, Ming Gong, Guido Zuccon, and Daxin Jiang
Arxiv 2022 [paper] [Code]
DynamicRetriever: A Pre-training Model-based IR System with Neither Sparse nor Dense Index
Zhou et al
Arxiv 2022 [paper]
Ultron: An Ultimate Retriever on Corpus with a Model-based Indexer
Zhou et al
Arxiv 2022 [paper]
Planning Ahead in Generative Retrieval: Guiding Autoregressive Generation through Simultaneous Decoding
Hansi Zeng ,Chen Luo ,Hamed Zamani
arXiv – Apr 2024 [paper] [Code]
NOVO: Learnable and Interpretable Document Identifiers for Model-Based IR
Zihan Wang, Yujia Zhou, Yiteng Tu, Zhicheng Dou
CIKM 2023 - October 2023 [paper]
Generative Retrieval as Multi-Vector Dense Retrieval
Shiguang Wu, Wenda Wei, Mengqi Zhang, Zhumin Chen, Jun Ma, Zhaochun Ren, Maarten de Rijke, Pengjie Ren
SIGIR 2024 - March 24 [paper] [Code]
Re3val: Reinforced and Reranked Generative Retrieval
EuiYul Song, Sangryul Kim, Haeju Lee, Joonkee Kim, James Thorne
EACL Findings 2023 – Jan 24 [paper]
GLEN: Generative Retrieval via Lexical Index Learning
Sunkyung Lee, Minjin Choi, Jongwuk Lee
EMNLP 2023 - December 23 [paper] [Code]
Enhancing Generative Retrieval with Reinforcement Learning from Relevance Feedback
Yujia Zhou, Zhicheng Dou, Ji-Rong Wen
EMNLP 2023 - December 23 [paper]
Generative Retrieval with Large Language Models
匿名
ICLR 24 – October 23 [paper]
Semantic-Enhanced Differentiable Search Index Inspired by Learning Strategies
Yubao Tang, Ruqing Zhang, Jiafeng Guo, Jiangui Chen, Zuowei Zhu, Shuaiqiang Wang, Dawei Yin, Xueqi Cheng
KDD 2023 – May 2023 [paper]
Term-Sets Can Be Strong Document Identifiers For Auto-Regressive Search Engines
Peitian Zhang, Zheng Liu, Yujia Zhou, Zhicheng Dou, Zhao Cao
arXiv – May 2023 [paper] [Code]
A Unified Generative Retriever for Knowledge-Intensive Language Tasks via Prompt Learning
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Yiqun Liu, Yixing Fan, Xueqi Cheng
SIGIR 2023 – Apr 2023 [paper] [Code]
CorpusBrain: Pre-train a Generative Retrieval Model for Knowledge-Intensive Language Tasks
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Yiqun Liu, Yixing Fan, Xueqi Cheng
CIKM 2022 – Aug 2022 [paper] [Code]
Autoregressive Search Engines: Generating Substrings as Document Identifiers
Michele Bevilacqua, Giuseppe Ottaviano, Patrick Lewis, Wen-tau Yih, Sebastian Riedel, Fabio Petroni
arXiv – Apr 2022 [paper] [Code]
Autoregressive Entity Retrieval
Nicola De Cao, Gautier Izacard, Sebastian Riedel, Fabio Petroni
ICLR 2021 – Oct 2020 [paper] [Code]
Data-Efficient Autoregressive Document Retrieval for Fact Verification
James Thorne
SustaiNLP@EMNLP 2022 – Nov 2022 [paper]
GERE: Generative Evidence Retrieval for Fact Verification
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Yixing Fan, Xueqi Cheng
SIGIR 2022 [paper] [Code]
Generative Multi-hop Retrieval
Hyunji Lee, Sohee Yang, Hanseok Oh, Minjoon Seo
arXiv – Apr 2022 [paper]
Improving LLMs for Recommendation with Out-Of-Vocabulary Tokens
Ting-Ji Huang, Jia-Qi Yang, Chunxu Shen, Kai-Qi Liu, De-Chuan Zhan, Han-Jia Ye
arXiv – Jun 2024 [paper]
Plug-in Diffusion Model for Sequential Recommendation
Haokai Ma, Ruobing Xie, Lei Meng, Xin Chen, Xu Zhang, Leyu Lin, Zhanhui Kang
arXiv – Jan 2024 [paper]
Towards Graph-Aware Diffusion Modeling For Collaborative Filtering Yunqin Zhu1, Chao Wang, Hui Xiong
arXiv – Nov 2023 [paper]
RecMind: Large Language Model Powered Agent For Recommendation
Yancheng Wang, Ziyan Jiang, Zheng Chen, Fan Yang, Yingxue Zhou, Eunah Cho, Xing Fan, Xiaojiang Huang, Yanbin Lu, Yingzhen Yang
arXiv – Aug 2023 [paper]
Is ChatGPT Fair for Recommendation? Evaluating Fairness in Large Language Model Recommendation
Jizhi Zhang, Keqin Bao, Yang Zhang, Wenjie Wang, Fuli Feng, Xiangnan He
Recsys 2023 – Jul 2023 [paper]
RecFusion: A Binomial Diffusion Process for 1D Data for Recommendation
Gabriel Bénédict, Olivier Jeunen, Samuele Papa, Samarth Bhargav, Daan Odijk, Maarten de Rijke
arXiv – Jun 2023 [paper]
A First Look at LLM-Powered Generative News Recommendation
Qijiong Liu, Nuo Chen, Tetsuya Sakai, Xiao-Ming Wu
arXiv – Jun 2023 [paper]
Large Language Models as Zero-Shot Conversational Recommenders
Yupeng Hou, Junjie Zhang, Zihan Lin, Hongyu Lu, Ruobing Xie, Julian McAuley, Wayne Xin Zhao
arXiv – May 2023 [paper]
DiffuRec: A Diffusion Model for Sequential Recommendation
Zihao Li, Aixin Sun, Chenliang Li
arXiv – Apr 2023 [paper]
Diffusion Recommender Model
Wenjie Wang, Yiyan Xu, Fuli Feng, Xinyu Lin, Xiangnan He, Tat-Seng Chua
SIGIR 2023 – Apr 2023 [paper]
Blurring-Sharpening Process Models for Collaborative Filtering
Jeongwhan Choi, Seoyoung Hong, Noseong Park, Sung-Bae Cho
SIGIR 2023 – Apr 2023 [paper] [code]
Recommender Systems with Generative Retrieval
Shashank Rajput, Nikhil Mehta, Anima Singh, Raghunandan Keshavan, Trung Vu, Lukasz Heldt, Lichan Hong, Yi Tay, Vinh Q. Tran, Jonah Samost, Maciej Kula, Ed H. Chi, Maheswaran Sathiamoorthy
non-archival – Mar 2023 [paper]
Pre-train, Prompt and Recommendation: A Comprehensive Survey of Language Modelling Paradigm Adaptations in Recommender Systems
Peng Liu, Lemei Zhang, Jon Atle Gulla
arXiv – Feb 2023 [paper]
Generative Slate Recommendation with Reinforcement Learning
Romain Deffayet, Thibaut Thonet, Jean-Michel Renders, and Maarten de Rijke
WSDM 2023 – Feb 2023 [paper]
Recommendation via Collaborative Diffusion Generative Model
Joojo Walker, Ting Zhong, Fengli Zhang, Qiang Gao, Fan Zhou
KSEM 2022 – Aug 2022 [paper]
DocGraphLM: Documental Graph Language Model for Information Extraction
Dongsheng Wang, Zhiqiang Ma, Armineh Nourbakhsh, Kang Gu, Sameena Shah
arXiv – Jan 2024 [paper]
KBFormer: A Diffusion Model for Structured Entity Completion
Ouail Kitouni, Niklas Nolte, James Hensman, Bhaskar Mitra
arXiv – Dec 2023 [paper]
From Retrieval to Generation: Efficient and Effective Entity Set Expansion
Shulin Huang, Shirong Ma, Yangning Li, Yinghui Li, Hai-Tao Zheng, Yong Jiang
arXiv – Apr 2023 [paper]
Crawling the Internal Knowledge-Base of Language Models
Roi Cohen, Mor Geva, Jonathan Berant, Amir Globerson
arXiv – Jan 2023 [paper]
Prompt Tuning or Fine-Tuning - Investigating Relational Knowledge in Pre-Trained Language Models
Leandra Fichtel, Jan-Christoph Kalo, Wolf-Tilo Balke
AKBC 2021 – [paper]
知識ベースとしての言語モデル?
Fabio Petroni, Tim Rocktäschel, Patrick Lewis, Anton Bakhtin, Yuxiang Wu, Alexander H. Miller, Sebastian Riedel
EMNLP 2019 – Sep 2019 [paper]
Although some of these are not accompanied by a paper, they might be useful to other Generative IR researchers for empirical studies or interface design considerations.
⚡ Gemini Dec 2023 [live] ⚡️ factiverse Jun 2023 [live] ⚡️ devmarizer Mar 2023 [live] ⚡️ TaxGenius Mar 2023 [live] ⚡️ doc-gpt Mar 2023 [live] ⚡️ book-gpt Feb 2023 [live] ⚡️ Neeva Feb 2023 [live] ⚡️ Golden Retriever Feb 2023 [live] ⚡️ Bing – Prometheus Feb 2023 [waitlist] ⚡️ Google – Bard Feb 2023 [only in certain countries] ⚡️ Paper QA Feb 2023 [code] [demo] ⚡️ DocsGPT Feb 2023 [live] [code] ⚡️ DocAsker Jan 2023 [live] ⚡️ Lexii.ai Jan 2023 [live] ⚡️ YOU.com Dec 2022 [live] ⚡️ arXivGPT Dec 2022 [Chrome extension] ⚡️ GPT Index Nov 2022 [API] ⚡️ BlenderBot Aug 2022 [live (USA)] [model weights] [code] [paper1] [paper2] ⚡️ PHIND date? [live] ⚡️ Perplexity date? [live] ⚡️ Galactica date? [demo] [API] [paper] ⚡️ Elicit date? [live] ⚡️ ZetaAlpha date? [live] uses OpenAI API
To get just the paper titles do grep '**' README.md | sed 's/**//g'