تنزيل awesome generative information retrieval - تنزيل رمز مصدر awesome generative information retrieval

awesome generative information retrieval

شفرة المصدر الأخرى

1.0.0

تنزيل

رهيبة التكاثر-المعلومات-Recrival

بدأت نماذج المحادثة قادرة على الوصول إلى الويب أو النسخ الاحتياطي مطالباتها بالمصادر (المعروف أيضًا باسم الإسناد). وبالتالي ، يمكن القول أن هذه الدردشة هي آلات استرجاع المعلومات ، وتنافس على محركات البحث التقليدية أو حتى الاستبدال. نود تكريس مساحة لهذه النماذج ولكن أيضًا إلى المجال الأكثر عمومية لاسترجاع المعلومات التوليدية. نحن نؤدي مبدئيًا إلى الحقل في موضوعين رئيسيين: توليد الإجابات المستردية واسترجاع المستندات التوليدي . نحن ندرج أيضًا توصية توليدية ، وتلخيص تراكم أساسي وما إلى ذلك.

ترحيب السحب الترحيب!

جدول المحتويات

منشورات المدونة
مجموعات البيانات
أدوات
تقييم
ورش العمل والدروس
أوراق نظرية المعرفة
جيل الإجابة على أساس
- الجيل المعزز للاسترجاع (RAG) (التأريض الخارجي/الاسترجاع في وقت الاستدلال)
- معالجة الذاكرة LLM (ترتكز في أوزان النموذج الداخلي في وقت الاستنتاج)
- إعادة الرابطة
- التصحيح الذاتي
- تقديرات عدم اليقين حقيقة
- جيل مقيد
- تركز البيانات
- تعظيم المنفعة
- متعدد الوسائط
- المطالبة
- إنشاء رمز
- جيل الاستعلام
- التلخيص وإعادة كتابة المستندات
- الجدول QA
استرجاع المستند التوليدي
- قم بإنشاء معرف مستند كمعرف
- إنشاء سلسلة كمعرف
- التطبيقات
توصية توليدية
الرسوم البيانية المعرفة التوليدية
الاسترجاع التوليدي المباشر

منشورات المدونة

اقتباس حتمي: جعل LLMS أكثر أمانًا للرعاية الصحية
مات يونغ
المدونة الشخصية - أبريل 2024 [رابط]

أبحاث الجيل المعزز للاسترجاع: 2017-2024
موريتز مالاويتش
تحجيم المعرفة - فبراير 2024 [رابط]

Mastering Rag: كيفية تعليم نظام خرقة المؤسسة
Pratik Bhavsar
Galileo Labs - يناير 2024 [رابط]

تشغيل Mixtral 8x7 محليًا مع Llamaindex
llamaindex
مدونة Llamaindex - ديسمبر 2023 [رابط]

تقنيات الخرقة المتقدمة: نظرة عامة مصورة
إيفان إيلين
نحو منظمة العفو الدولية - ديسمبر 2023 [رابط]

خط أنابيب خرقة متعددة الوسائط مع llamaindex و neo4j
توماز براتاني
مدونة Llamaindex - ديسمبر 2023 [رابط]

ترسيخ خرقة على الطاولات
لانجشين
مدونة Langchain - ديسمبر 2023 [رابط]

RAG المتقدم 01: استرجاع صغير إلى بيج
صوفيا يانغ
نحو علوم البيانات - نوفمبر 2023 [رابط]

التحولات الاستعلام
لانجشين
مدونة Langchain - أكتوبر 2023 [رابط]

ما الذي يجعل وكيل الحوار مفيدًا؟
نازنين راجاني ، ناثان لامبرت ، فيكتور سانه ، توماس وولف
مدونة Hugging Face - يناير 2023 [رابط]

التنبؤ بسوء استخدام نماذج اللغة المحتملة لحملات التضليل وكيفية تقليل المخاطر
Josh A. Goldstein ، Girish Sastry ، Micah Musser ، Renée Diresta ، Matthew Gentzel ، Katerina Sedova
مدونة Openai - يناير 2023 [رابط]

مجموعات البيانات

الحقيقة ، الجلب ، والعقل: تقييم موحد لجيل ساتيابريا كريشنا ، كالبش كريشنا ، أنهاد موهاناني ، ستيفن شواراركز ، آدم ستامبلر ، شيام أوبادهياي ، مانال فروكي آرسف-سبعة 2024 [ورقة] [بيانات]

Litsearch: معيار استرجاع للبحث في الأدب العلمي
Anirudh Ajith ، Mengzhou Xia ، Alexis Chevalier ، Tanya Goyal ، Danqi Chen ، Tianyu Gao
Arxiv - يوليو 2023 [ورقة] [بيانات]

مشرق: معيار واقعي وصعب لاسترجاع كثافة التفكير
هونغجين سو ، هوارد ين ، مينغتشو شيا ، ويجيا شي ، نيكلاس مونيهوف ، هان يو وانغ ، هايسو ليو ، كوان شي ، زاكاري س.
ARXIV - أكتوبر 2023 [ورقة] [بيانات] [رمز]

Freshllms: نماذج لغة كبيرة منعشة مع زيادة محرك البحث
Tu Vu ، Mohit Iyyer ، Xuezhi Wang ، Noah Constain
ARXIV - أكتوبر 2023 [ورقة] [رمز]

LegalBench: معيار تم إنشاؤه بشكل تعاوني لقياس التفكير القانوني في نماذج اللغة الكبيرة
نيل جوها ، جوليان نياركو ، دانييل إ. هو ، كريستوفر ري ، آدم تشيلتون ، أديتيا نارايانا ، أليكس تشولاس وود ، أوستن بيترز ، براندون والدون ، دانييل ن. روكمور ، دييغو زامبرانو ، ديمتري تالسيمان ، إكوك ، فايز سوراني ، فرانك فاجان ، جيسون هيغلاند ، جيسيكا وو ، جو نودل ، جويل نيكلاوس ، جون ناي ، جوناثان هـ. تشوي ، كيفن توبيا ، مارغريت هاجان ، ميغان ما ، مايكل ليفرم ، نيكون راسوموف راهي ، نيلز هولزنبرغر ، نام كولت ، بيتر هيندسون ، شاراد جول وليامز ، صني غاندي ، توم زيور ، فارون آير ، زيهوا لي
ARXIV - أغسطس 2023 [ورقة] [مجموعة البيانات]

محادثات منفتحة - إضفاء الطابع الديمقراطي على محاذاة نموذج اللغة الكبيرة
Andreas Köpf ، Yannic Kilcher ، Dimitri Von Rütte ، Sotiris Anagnostidis ، Zhi-Rui Tam ، Keith Stevens ، Abdullah Barhoum ، Nguyen Minh Duc ، Oliver Stanley ، Richárd Nagyfi ، Shahul es ، seaph suri ، شوهمان ، هوو نغوين ، ألكساندر ماتيك
ARXIV - أبريل 2023 [ورقة]

chatgpt-retrivalqa
أريان أسكاري ، محمد عليانيجادي ، إيفانجيلوس كانولاس ، سوزان فيربرن
Github - فبراير 2023 [رمز]

كاميل: تحليل المعرفة مع كيانات متعددة في نماذج اللغة
Jan-Christoph Kalo ، Leandra Fichtel
AKBC 22 - [ورقة]

صدق: قياس كيف تحاكي النماذج الأكاذيب البشرية
ستيفاني لين ، يعقوب هيلتون ، أوين إيفانز
Arxiv - سبتمبر 2021 [ورقة] [رمز]

استرجاع الإجابة المعقدة
لورا ديتز ، مانيشا فيرما ، فيليب رادلينسكي ، نيك كراسويل ، بن جاماري ، جيف دالتون ، جون فولي
TREC-2017-2019 [LINK]

أدوات

Graphrag
جوناثان لارسون ، ستيفن ترويت
Microsoft - فبراير 2024 [رمز]

تضييق فجوة تقييم المعرفة: سؤال مفتوح المجال الإجابة على الإجابات متعددة الحجبات
غال يونا ، روي أهاروني ، مور جيفا
ARXIV - يناير 2024 [ورقة]

ورشة DHS LLM - الوحدة 6
Sourab Mangrulkar
Github - ديسمبر 2023 [رمز]

PrimeQA: المستودع الرئيسي لحالة الأسئلة المتعددة اللغات التي تجيب على البحث والتطوير
Avirup Sil ، Jaydeep Sen ، Bhavani Iyer ، Martin Franz ، Kshitij Fadnis ، Mihaela Bornea ، Sara Rosenthal ، Scott McCarley ، Rong Zhang ، Vishwajeet Kumar ، Yulong Li ، Md Arafat Sultan ، Riaz Bhat
ARXIV - يناير 2023 [ورقة] [رمز]

TRL: تعلم التعزيز المحول
Leandro Von Werra ، Younes Belkada ، Lewis Tunstall ، Edward Beeching ، Tristan Thrush ، Nathan Lambert ، Shengyi Huang
Github - 2020 [رمز]

تقييم

FactScore: التقييم الذري ذو الحبيبات الدقيقة للدقة الواقعية في توليد النص الطويل
Sewon Min ، Kalpesh Krishna ، Xinxi Lyu ، Mike Lewis ، Wen-Tau Yih ، Pang Wei Koh ، Mohit Iyyer ، Luke Zettlemoyer ، Hannaneh Hajishirzi
PYPI - مايو 2023 [ورقة] [رمز]

Factkb: تقييم الحقائق القابلة للتعميم باستخدام نماذج اللغة المعززة بالمعرفة الواقعية
شنغبين فنغ ، فيديشا بالاشاندران ، يويانغ باي ، يوليا تسفيتكوف
ARXIV - مايو 2023 [ورقة] [رمز]

تقييم التحقق في محركات البحث التوليدي
نيلسون ف. ليو ، تيانيي تشانغ ، بيرسي ليانغ
ARXIV - أبريل 2023 [ورقة] [رمز]

ورش العمل والدروس

ورشة عمل حول الذكاء الاصطناعي لأنظمة التوصية والتخصيص
Narges Tabari ، Aniket Deshmukh ، Wang-Cheng Kang ، Rashmi Gangadharaiah ، Hamed Zamani ، Julian McAuley ، George Karypis
KDD 24 - أغسطس 2024 [رابط]

ورشة العمل الثانية حول استرجاع المعلومات التقليدية
غابرييل بينيديكت ، روكينغ تشانغ ، دونالد ميتزلر ، أندرو ييتس ، زيان جيانغ
Sigir 24 - يوليو 2024 [رابط]

الذكاء الاصطناعى التوليدي الشخصية
Zheng Chen ، Ziyan Jiang ، Fan Yang ، Zhankui He ، Yupeng Hou ، Eunah Cho ، Julian Mcauley ، Aram Galstyan ، Xiaohua Hu ، Jie Yang
Cikm 23 - أكتوبر 2023 [رابط]

ورشة العمل الأولى حول التوصية مع النماذج التوليدية
Wenjie Wang ، Yong Liu ، Yang Zhang ، Weiwen Liu ، Fuli Feng ، Xiangnan He ، Aixin Sun
Cikm 23 - أكتوبر 2023 [رابط]

ورشة العمل الأولى حول استرجاع المعلومات التقليدية
غابرييل بينيديكت ، روكينغ تشانغ ، دونالد ميتزلر
سيجير 23 - يوليو 2023 [رابط]

نماذج وتطبيقات اللغة القائمة على الاسترجاع
Akari Asai ، Sewon Min ، Zexuan Zhong ، Danqi Chen
ACL 23 - يوليو 2023 [رابط]

أوراق نظرية المعرفة

استرجاع المعلومات الوكيل
Weinan Zhang ، Junwei Liao ، Ning Li ، Kounianhua du
ARXIV - أكتوبر 2024 [ورقة]

تلاوة ، إعادة البناء ، التذكر: حفظ في LMS كظاهرة متعددة الأوجه
Usvsn Sai Prashanth ، Alvin Deng ، Kyle O'Brien ، Jyothir SV ، Mohammad Aflah Khan ، Jaydeep Borkar ، Christopher A.
Arxiv - Jun 2024 [Paper]

Chatgpt هراء
مايكل تاونسن هيكس ، جيمس همفريز ، جو سلاتر
أخلاقيات INF Technol - يونيو 2024 [ورقة]

هلوسة من نماذج اللغة الكبيرة متعددة الوسائط: دراسة استقصائية
Zechen Bai ، Pichao Wang ، Tianjun Xiao ، Tong HE ، Zongbo Han ، Zheng Zhang ، Mike Zheng Shou
ARXIV - أبريل 2024 [ورقة]

من المطابقة إلى الجيل: دراسة استقصائية حول استرجاع المعلومات التوليدية
Xiaoxi Li ، Jiajie Jin ، Yujia Zhou ، Yuyao Zhang ، Peitian Zhang ، Yutao Zhu ، and Zhicheng Dou
ARXIV - أبريل 2024 [ورقة]

صراعات المعرفة لـ LLMS: مسح
Rongwu Xu ، Zehan Qi ، Cunxiang Wang ، Hongru Wang ، Yue Zhang ، Wei Xu
Arxiv - مارس 2024 [ورقة]

تقرير عن ورشة العمل الأولى حول استرجاع المعلومات التوليدية (Gen-IR 2023) في Sigir 2023
غابرييل بينيديكت ، روكينغ تشانغ ، دونالد ميتزلر ، أندرو ييتس ، رومان ديفايت ، فيليب هاجر ، سامي جوليان
منتدى سيجير - ديسمبر 2023 [ورقة]

تقرير عن ورشة العمل الأولى حول IR تركز على المهمة في عصر الذكاء الاصطناعي التوليدي
Chirag Shah ، Ryen W. White
منتدى سيجير - ديسمبر 2023 [ورقة]

نحو البحث والتوصية التوليدية: الكلمة الرئيسية في Recsys 2023
Tat-Seng Chua
منتدى سيجير - ديسمبر 2023 [ورقة]

نموذج بحث كبير: إعادة تعريف مكدس البحث في عصر LLMS
Liang Wang ، Nan Yang ، Xiaolong Huang ، Linjun Yang ، Rangan Majumder ، Furu Wei
منتدى سيجير - ديسمبر 2023 [ورقة]

نماذج لغة كبيرة لاستخراج المعلومات التوليدية: مسح
DeRong Xu ، Wei Chen ، Wenjun Peng ، Chao Zhang ، Tong Xu ، Xiangyu Zhao ، Xian Wu ، Yefeng Zheng ، insong Chen
ARXIV - ديسمبر 2023 [ورقة]

استرجاع النص الكثيف بناءً على نماذج اللغة المسبقة: مسح
واين شين تشاو ، جينغ ليو ، رويانغ رن ، جي رونغ وين
TOIS - ديسمبر 2023 [ورقة]

جيل من أجل الاسترجاع لنماذج اللغة الكبيرة: دراسة استقصائية
Yunfan Gao ، Yun Xiong ، Xinyu Gao ، Kangxiang Jia ، Jinliu Pan ، Yuxi Bi ، Yi Dai ، Jiawei Sun ، Haofen Wang
ARXIV - ديسمبر 2023 [ورقة]

يجب أن تهلل نماذج اللغة المعايرة
آدم تاومان كالاي ، سانتوش س. فيمبالا
ARXIV - نوفمبر 2023 [ورقة]

أغنية صفارات الإنذار في محيط الذكاء الاصطناعي: دراسة استقصائية عن الهلوسة في نماذج اللغة الكبيرة
Yue Zhang ، Yafu Li ، Leyang Cui ، Deng Cai ، Lemao Liu ، Tingchen Fu ، Xinting Huang ، Enbo Zhao ، Yu Zhang ، Yulong Chen ، Longyue Wang ، Anh Tuan Luu ، Wei Bi ، Freda Shi ، Shuming Shi
Arxiv - سبتمبر 2023 [ورقة]

الوعد الخاطئ لتقليد ملكية الملكية
أرناف غوديباندي ، إريك والاس ، تشارلي سنيل ، Xinyang Geng ، Hao Liu ، Pieter Abbeel ، Sergey Levine ، Dawn Song
ARXIV - مايو 2023 [ورقة]

التوصية التوليدية: نحو نموذج التوصية من الجيل التالي
Fengji Zhang ، Bei Chen ، Yue Zhang ، Jin Liu ، Daoguang Zan ، Yi Mao ، Jian-Guang Lou ، Weizhu Chen
ARXIV - أبريل 2023 [ورقة]

نماذج اللغة المعززة: مسح
Grégoire Mialon ، Roberto Dessì ، Maria Lomeli ، Christoforos Nalmpantis ، Ram Pasunuru ، Roberta Raileanu ، Baptiste Rozière ، Timo Schick ، Jane Dwivedi-Yu ، Asli Celikyilmaz ، Edouard Grave ، Yann Lecun ، Thomas Scialom
Arxiv - فبراير 2023 [ورقة]

نماذج اللغة التوليدية وعمليات التأثير الآلي: التهديدات الناشئة والتخفيفات المحتملة
Josh A. Goldstein ، Girish Sastry ، Micah Musser ، Renee Diresta ، Matthew Gentzel ، Katerina Sedova
ARXIV - يناير 2023 [ورقة]

معلومات المحادثة. مقدمة في البحث عن المحادثة والتوصية والإجابة على الأسئلة
حامد زاماني ، يوهان ر. تريباس ، جيف دالتون وفيليب رادلينسكي
ARXIV - يناير 2023 [ورقة]

حقائق
كيفن موليجان وفابريس كوريا
موسوعة ستانفورد للفلسفة - شتاء 2021 [URL]

منظمة العفو الدولية الصادقة: تطوير وحكم الذكاء الاصطناعي لا يكذب
أوين إيفانز ، أوين كوتون بارات ، لوكاس فينفيدن ، آدم بالز ، أفيتال بالويت ، بيتر ويلز ، لوكا ريجيتي ، ويليام سوندرز
ARXIV - أكتوبر 2021 [ورقة]

إعادة التفكير في البحث: جعل خبراء المجالين من dilettantes
دونالد ميتزلر ، يي تاي ، دارا بهري ، مارك ناجورك
منتدى Sigir 2021 - مايو 2021 [ورقة]

جيل الإجابة على أساس

إجابة السؤال المنسوبة: تقييم ونمذجة نماذج اللغة الكبيرة المنسوبة
Bernd Bohnet ، Vinh Q. Tran ، Pat Verga ، Roee Aharoni ، Daniel Andor ، Livio Baldini Soares ، Jacob Eisenstein ، Kuzman Ganchev ، Jonathan Herzig ، Kai Hui ، Tom Kwiatkowki ، Ji Mai ، Jianmo Ni ، دونالد ميتزلر ، سلاف بتروف ، كيلي ويبستر
ARXIV - ديسمبر 2022 [ورقة]

الجيل المعزز للاسترجاع (خرقة)

التأريض الخارجي/الاسترجاع في وقت الاستدلال

رابتور: معالجة متكررة للاسترجاع منظم الأشجار
بارث سارثي ، سلمان عبد الله ، أديتي تولي ، شوب خانا ، آنا جولدي ، كريستوفر دي مانينغ
ICLR 24 - يناير 2024 [ورقة]

الجيل المعزز للاسترجاع التصحيحي
Shi-Qi Yan ، Jia-Chen Gu ، Yun Zhu ، Zhen-Hua Ling
ARXIV - يناير 2024 [ورقة]

لقد حان الوقت: دمج الزمن في نماذج اللغة المعززة للاسترجاع
Anoushka Gade ، Jorjeta Jetcheva
ARXIV - يناير 2024 [ورقة]

Rag Vs Tuning: خطوط أنابيب ، ومقايضات ، ودراسة حالة عن الزراعة
الملائكة بالاجوير ، فينامرا بينارا ، ريناتو لويز دي فريتاس كونها ، روبرتو دي م. إستيفو فيلهو ، تود هندري ، دانييل هولشتاين ، جينيفر مارسمان ، نيك ميكلنبورغ ، سارا مالفار ، ليوناردو. رانفير تشاندرا
ARXIV - يناير 2024 [ورقة]

تسلسل ma�tters: نموذج لتربية العينين لبناء وكلاء المحادثة
كوين باتواردهان ، غريس هوي يانغ
TREC 23 - نوفمبر 2023 [ورقة]

الرفق الذاتي: تعلم استرداد وتوليد ونقد من خلال التفكير الذاتي
مجهول
ICLR 24 - أكتوبر 2023 [ورقة]

RA-DIT: ضبط تعليمات مزدوجة في الاسترجاع
مجهول
ICLR 24 - أكتوبر 2023 [ورقة]

التعلم داخل السياق مع نماذج لغة الترميز المشفر المعزز للاسترجاع
مجهول
ICLR 24 - أكتوبر 2023 [ورقة]

جعل نماذج اللغة المتمحورة للاسترجاع قوية في سياق غير ذي صلة
مجهول
ICLR 24 - أكتوبر 2023 [ورقة]

يستوفي الاسترجاع نماذج لغة كبيرة
مجهول
ICLR 24 - أكتوبر 2023 [ورقة]

إعادة صياغة التكيف مع النماذج اللغوية الكبيرة كإعادة تهيئة
مجهول
ICLR 24 - أكتوبر 2023 [ورقة]

instructretro: تعليمات توليف ما بعد الاسترجاع قبل الاسترجاع
مجهول
ICLR 24 - أكتوبر 2023 [ورقة]

بالتأكيد: تحسين الإجابة على أسئلة المجال المفتوح عن طريق الاسترجاع الملخص
مجهول
ICLR 24 - أكتوبر 2023 [ورقة]

Recomp: تحسين LMS-Augmented مع ضغط السياق والزيادة الانتقائية
مجهول
ICLR 24 - أكتوبر 2023 [ورقة]

الاسترجاع جيل دقيق
مجهول
ICLR 24 - أكتوبر 2023 [ورقة]

PaperQA: وكيل توليني من أجل الاسترجاع للبحث العلمي
مجهول
ICLR 24 - أكتوبر 2023 [ورقة]

فهم زيادة الاسترجاع للإجابة على أسئلة طويلة الشكل
مجهول
ICLR 24 - أكتوبر 2023 [ورقة]

توليد اللغة المخصصة عن طريق استرجاع Bayesian Metric المعزز
مجهول
ICLR 24 - أكتوبر 2023 [ورقة]

DSPY: تجميع نموذج اللغة التعريفية يستدعي خطوط أنابيب تحسس ذاتيا
عمر خاتاب ، أرناف سينغفي ، باريدي ماهيشواري ، تشايوان تشانغ ، كيشاف سانثانام ، سري فاردهامانان ، سايفل الحقي
ARXIV - أكتوبر 2023 [ورقة] [رمز]

RA-DIT: ضبط تعليمات مزدوجة في الاسترجاع
شي فيكتوريا لين ، Xilun Chen ، Mingda Chen ، Weijia Shi ، Maria Lomeli ، Rich James ، Pedro Rodriguez ، Jacob Kahn ، Gergely Szilvasy ، Mike Lewis ، Luke Zettlemoyer ، Scott Yih
ARXIV - أغسطس 2023 [ورقة]

تتيح توثيق الأدوات استخدام الأدوات الصفرية مع نماذج لغة كبيرة
Cheng-Yu Hsieh ، Si-an Chen ، Chun-Liang Li ، Yasuhisa Fujii ، Alexander Ratner ، Chen-Yu Lee ، Ranjay Krishna ، Tomas Pfister
ARXIV - أغسطس 2023 [ورقة]

REAUGKD: تقطير المعرفة المتمثل في الاسترجاع لنماذج اللغة التي تم تدريبها مسبقًا
Jianyi Zhang ، Aashiq Muhamed ، Aditya Anantharaman ، Guoyin Wang ، Changyou Chen ، Kai Zhong ، Qingjun Cui ، Yi Xu ، Belinda Zeng ، Trishul Chilimbi ، Yiran Chen
ACL 23 - يوليو 2023 [ورقة]

الاسترجاع القائم على السطح يقلل من حيرة النماذج اللغوية التي يتم التغلب عليها الاسترجاع
Ehsan Doostmohammadi ، توبياس نورلوند ، ماركو كولمان ، ريتشارد جوهانسون
ACL 23 - يوليو 2023 [ورقة]

ضبط موجه ناعم لزيادة الاسترجاع الكثيف مع نماذج اللغة الكبيرة
Zhiyuan Peng ، Xuyang Wu ، Yi Fang
Arxiv - Jun 2023 [Paper]

Reta-Llm: مجموعة أدوات نموذج لغوية كبيرة من أجل الاسترجاع
Jiongnan Liu ، Jiajie Jin ، Zihan Wang ، Jiehan Cheng ، Zhicheng Dou ، Ji-Rong Wen
Arxiv - Jun 2023 [Paper]

WebGLM: نحو نظام الإجابة على أسئلة فعالة على شبكة الإنترنت مع تفضيلات الإنسان
Xiao Liu ، Hanyu Lai ، Hao Yu ، Yifan Xu ، Aohan Zeng ، Zhengxiao Du ، Peng Zhang ، Yuxiao Dong ، Jie Tang
Arxiv - Jun 2023 [Paper]

ويكيشات: إيقاف الهلوسة من chatbots نموذج اللغة الكبيرة عن طريق قليلة من الأساس على ويكيبيديا
Sina J. Semnani ، Violet Z. Yao ، Heidi C. Zhang ، Monica S. Lam
نتائج EMNLP 2023 - مايو 2023 [ورقة] [رمز] [DEMO]

RET-LLM: نحو ذاكرة عامة للقراءة والكتابة لنماذج اللغة الكبيرة
علي مودريري ، أييوب إيماني ، محسن فاياز ، هينريتش شوتز
ARXIV - مايو 2023 [ورقة]

الغوريلا: نموذج لغة كبير مرتبط بأبواع واجهات برمجة التطبيقات الضخمة
Shishir G. Patil ، Tianjun Zhang ، شين وانغ ، جوزيف E. Gonzalez
ARXIV - مايو 2023 [ورقة] [رمز]

هل نحن قبل النماذج اللغوية التلقائية قبل الاسترجاع؟ دراسة شاملة
Boxin Wang ، Wei Ping ، Peng Xu ، Lawrence McAfee ، Zihan Liu ، Mohammad Shoeybi ، Yi Dong ، Oleksii Kuchaiev ، Bo Li ، Chaowei Xiao ، Anima Anandkumar ، Bryan Catanzaro
ARXIV - APR 2023 [PAPER] [CODE]

تحقق من حقائقك وحاول مرة أخرى: تحسين نماذج اللغة الكبيرة مع المعرفة الخارجية والتعليقات الآلية
Baolin Peng ، Michel Galley ، Pengcheng He ، Hao Cheng ، Yujia Xie ، Yu Hu ، Qiuyuan Huang ، Lars Liden ، Zhou Yu ، Weizhu Chen ، Jianfeng Gao
Arxiv - فبراير 2023 [ورقة] [رمز]

Toolformer: يمكن أن تعلّم نماذج اللغة أنفسهم لاستخدام الأدوات
تيمو شيك ، جين دويفيدي يو ، روبرتو ديسي ، روبرتا رايلينو ، ماريا لوميلي ، لوك زيتليموير ، نيكولا كانسيددا ، توماس سكاليوم
Arxiv - فبراير 2023 [ورقة]

إعادة التجديد: نماذج لغة صندوق الأسود المتقنة استرجاعها
Weijia Shi ، Sewon Min ، Michihiro Yasunaga ، Minjoon Seo ، Rich James ، Mike Lewis ، Luke Zettlemoyer ، Wen-Tau Yih
ARXIV - يناير 2023 [ورقة]

نماذج لغوية Racktrival-Aguctival في السياق
Ori Ram ، Yoav Levine ، Itay Dalmedigos ، Dor Muhlgay ، Amnon Shashua ، Kevin Leyton-Brown ، Yoav Shoham
AI21 Labs - يناير 2023 [ورقة] [رمز]

وصفات لبناء chatbot في المجال المفتوح
ستيفن رولر ، إميلي دينان ، نامان جويال ، دا جو ، ماري ويليامسون ، يينهان ليو ، جينغ شو ، مايل أوت ، إريك مايكل سميث ، يان لان بورو ، جايسون ويستون
EACL 2021 - أبريل 2021 [ورقة]

عتمان: فهم تنبؤات المحول من خلال معالجة الانتباه فعالة الذاكرة
حامد زاماني ، يوهان ر. تريباس ، جيف دالتون وفيليب رادلينسكي
ARXIV - يناير 2023 [ورقة]

Retromae V2: Duplex مقنّع للتشفير التلقائي لنماذج اللغة الموجه نحو الاسترجاع قبل التدريب
شياو شياو ، تشنغ ليو
ARXIV - نوفمبر 2023 [ورقة]

إظهار SEARK-PREFERICT: تأليف نماذج استرجاع ولغة من أجل NLP Omar Khattab كثيفة المعرفة ، Keshav Santhanam ، Xiang Lisa Li ، David Hall ، Percy Liang ، Christopher Potts ، Matei Zaharia
ARXIV - ديسمبر 2022 [ورقة]

تحسين نماذج اللغة من خلال الاسترداد من تريليونات من الرموز
سيباستيان بورجيود ، آرثر مينش ، جوردان هوفمان ، تريفور كاي ، إليزا راذرفورد ، كاتي ميليكان ، جورج فان دن دريسهشي ، جان-بابيست ليسبيو ، رينغان ، تومان ، تومان ، تومان ، تومان ، تومان ، لورين ماجيور ، كريس جونز ، ألبين كاساير ، آندي بروك ، ميشيلا باجانيني ، جيفري إيرفينغ ، أوريول فينالس ، سيمون أوسيندرو ، كارين سيمونيان ، جاك دبليو راي ، إريك إلسن ، لورينت سيفري
Arxiv - فبراير 2022 [ورقة]

تحسين نماذج اللغة من خلال الاسترداد من تريليونات من الرموز
سيباستيان بورجيود ، آرثر مينش ، جوردان هوفمان ، تريفور كاي ، إليزا راذرفورد ، كاتي ميليكان ، جورج فان دن دريسهشي ، جان-بابيست ليسبيو ، رينغان ، تومان ، تومان ، تومان ، تومان ، تومان ، لورين ماجيور ، كريس جونز ، ألبين كاساير ، آندي بروك ، ميشيلا باجانيني ، جيفري إيرفينغ ، أوريول فينالس ، سيمون أوسيندرو ، كارين سيمونيان ، جاك دبليو راي ، إريك إلسن ، لوران سيفري
ARXIV - ديسمبر 2021 [ورقة]

WebGPT: إجابة أسئلة بمساعدة المتصفح مع ردود الفعل البشرية
Reiichiro Nakano ، Jacob Hilton ، Suchir Balaji ، Jeff Wu ، Long Ouyang ، Christina Kim ، Christopher Hesse ، Shantanu Jain ، Vineet Kosaraju ، William Saunders ، Xu Jiang ، Karl Cobbe ، Tyna Eloundou ، Gretchen Krueger ، Kevin Mattle
ARXIV - ديسمبر 2021 [ورقة]

Bert-Knn: إضافة مكون بحث KNN إلى نماذج اللغة المسبقة لتحسين ضمان الجودة
نورا كاسنر ، هينريش شوتز
EMNLP 2020 - نوفمبر 2020 [ورقة]

عالم: نموذج اللغة المسبق للاسترجاع قبل التدريب
كيلفن غو ، كنتون لي ، زورا تونغ ، بانوبونج باسوبات ، مينغ واي تشانغ
ICML 2020 - يوليو 2020 [ورقة]

نموذج محادثة عصبية استرجاع هجين
Liu Yang ، Junjie Hu ، Minghui Qiu ، Chen Qu ، Jianfeng Gao ، W. Bruce Croft ، Xiaodong Liu ، Yelong Shen ، Jingjing Liu
ARXIV - أبريل 2019 [ورقة]

LLM معالجة الذاكرة

ترتكز في أوزان النموذج الداخلي في وقت الاستدلال

كيف تكتسب نماذج اللغة الكبيرة معرفة واقعية أثناء التدريب؟
Hoyeon Chang ، Jinho Park ، Seonghyeon Ye ، Sohee Yang ، Youngkyung Seo ، Du-Seong Chang ، Minjoon SEO
Arxiv - Jun 2024 [Paper]

نماذج لغة صقلها من أجل الواقعية
كاثرين تيان ، إريك ميتشل ، هوكسيو ياو ، كريستوفر مانينغ ، تشيلسي فين
ARXIV - نوفمبر 2023 [ورقة]

R-Tuning: تدريس نماذج لغة كبيرة لرفض أسئلة غير معروفة
Hanning Zhang ، Shizhe Dioo ، Yong Lin ، Yi R. Fung ، Qing Lian ، Xingyao Wang ، Yangyi Chen ، Heng Ji ، Tong Zhang
ARXIV - نوفمبر 2023 [ورقة]

Easyedit: إطار تحرير المعرفة سهل الاستخدام لنماذج اللغة الكبيرة
Peng Wang ، Ningyu Zhang ، Xin Xie ، Yunzhi Yao ، Bozhong Tian ، Mengru Wang ، Zekun XI ، Siyuan Cheng ، Kangwei Liu ، Guozhou Zheng ، Huajun Chen
ARXIV - أغسطس 2023 [ورقة]

تفتيش وتحرير تمثيل المعرفة في نماذج اللغة
إيفان هيرنانديز ، بيليندا ز. لي ، يعقوب أندرياس
ARXIV - APR 2023 [PAPER] [CODE]

الاستفادة من استرجاع الممر مع النماذج التوليدية للإجابة على سؤال المجال المفتوح
Gautier Izacard ، Edouard Grave
Arxiv - فبراير 2023 [ورقة]

اكتشاف المعرفة الكامنة في نماذج اللغة دون إشراف
كولين بيرنز ، هاوتيان يي ، دان كلاين ، يعقوب شتاينهاردت
ICLR 23 - فبراير 2023 [ورقة] [رمز]

Galactica: نموذج لغة كبير للعلوم
روس تايلور ، مارسين كاردا ، غيلم كوكورول ، توماس سكاليوم ، أنتوني هارتشورن ، إلفيس سارافيا ، أندرو بولتون ، فيكتور كيركز ، روبرت ستوجنيك
galactica.org - 2022 [ورقة]

Blenderbot 3: وكيل محادثة تم نشره يتعلم باستمرار الانخراط بمسؤولية
Kurt Shuster ، Jing Xu ، Mojtaba Komeili ، Da Ju ، Eric Michael Smith ، Stephen Roller ، Megan Ung ، Moya Chen ، Kushal Arora ، Joshua Lane ، Morteza Behrooz ، William Ngan ، Spencer Poff ، Naman Goyal ، Arthur Szlam ،
ARXIV - أغسطس 2022 [ورقة]

توليد بدلاً من الاسترداد: نماذج لغة كبيرة هي مولدات سياق قوية
Wenhao Yu ، Dan Iter ، Shuohang Wang ، Yichong Xu ، Mingxuan Ju ، Soumya Sanyal ، Chenguang Zhu ، Michael Zeng ، Meng Jiang
ICLR 2023 - سبتمبر 2022 [ورقة]

نماذج لغة التلاوة
Zhiqing Sun ، Xuezhi Wang ، Yi Tay ، Yiming Yang ، Denny Zhou
ICLR 2023 - سبتمبر 2022 [ورقة]

تحسين محاذاة وكلاء الحوار عبر الأحكام البشرية المستهدفة
أميليا جلايز ، نات ماكاليز ، ماجا تراتباكز ، جون أسلانيدس ، فلاد فيرو ، تيمو إيوالدز ، ماريبيث روه ، لورا ويديندر ، مارتن تشادويك ، فيبي ثاكر ، رامان ، رامان ، رامان ، Dathathri ، Rory Greig ، Charlie Chen ، Doug Fritz ، Jaume Sanchez Elias ، Richard Green ، Soňa Mokrá ، Nicholas Fernando ، Boxi Wu ، Rachel Foley ، Susannah Young ، IASON GABRIEL ، William Isaac ، John Mellor ، Demis Hassabis ، Kavukcu. هندريكس ، جيفري ايرفينغ
Arxiv - سبتمبر 2022 [ورقة]

لامدا: نماذج لغة لتطبيقات الحوار
رومال ثوببيلان ، دانييل دي فريتاس ، جيمي هول ، نام شازير ، أبورف كولشريشتا ، هينغ تيس تشنغ ، أليسيا جين ، تايلور بوس ، ليزلي بيكر ، يو دو ، ياجوانغ لي ، هونغري لي ، هويكسيو ستيفن تشنغ ، آمين غاغافوري ، مارشينج. Krikun ، Dmitry Lepikhin ، James Qin ، Dehao Chen ، Yuanzhong Xu ، Zhifeng Chen ، Adam Roberts ، Maarten Bosma ، Vincent Zhao ، Yanqi Zhou ، Chung-Ching Chang ، Igor Krivokon ، Will Rusch ، Marc Pickett ، Pranesh Srinivan ، Meredith Ringel Morris ، Tulsee Doshi ، Renelito Delos Santos ، Toju Duke ، Johnny Soraker ، Ben Zevenbergen ، Vinodkumar Prabhakaran ، Mark Diaz ، Ben Hutchinson ، Kristen Olson ، Alejandra Molina ، Erin Hoffman-Joh. بورينا ، ماثيو لام ، فيكتوريا كوزمينا ، جو فنتون ، آرون كوهين ، راشيل بيرنشتاين ، راي كورزويل ، بليز أغويرا أرتاس ، كلير كوي ، ماريان كراك ، إد تشي ، كوك لي
ARXIV - يناير 2022 [ورقة]

نماذج اللغة أو لقواعد المعرفة
سيمون رازنوفسكي ، أندرو ييتس ، نورا كاسنر ، جيرهارد وايكوم
DL4KG 2021 - أكتوبر 2021 [ورقة]

التعميم من خلال الحفظ: أقرب نماذج لغة الجوار
Urvashi Khandelwal ، Omer Levy ، Dan Jurafsky ، Luke Zettlemoyer ، Mike Lewis
ICLR 2020 - سبتمبر 2019 [ورقة] [رمز]

إعادة الرابطة

هل chatgpt جيد في البحث؟ التحقيق في نماذج اللغة الكبيرة كعوامل إعادة صلة
Wenhao Yu ، Hongming Zhang ، Xiaoman Pan ، Kaixin MA ، Hongwei Wang ، Dong Yu
ARXIV - نوفمبر 2023 [ورقة]

تقطير التعليمات يجعل نماذج اللغة الكبيرة تصادفًا صفراً صفرًا
Weiwei Sun ، Zheng Chen ، Xinyu Ma ، Lingyong Yan ، Shuaiqiang Wang ، Pengjie Ren ، Zhumin Chen ، Dawei Yin ، Zhaochun Ren
Arxiv 2023 - نوفمبر 2023 [ورقة]

التصحيح الذاتي

الناقد: يمكن أن تصنع نماذج اللغة الكبيرة ذاتية مع انتقاد الأدوات التفاعلية
Zhibin Gou ، Zhihong Shao ، Yeyun Gong ، Yelong Shen ، Yujiu Yang ، Nan Duan ، Weizhu Chen
ICLR 2024 - يناير 2024 [ورقة]

يوفر غرزة في الوقت تسعة: اكتشاف وهلوسة التخفيف من LLMs عن طريق التحقق من صحة توليد الثقة المنخفضة
Neeraj Varshney ، Wenlin Yao ، Hongming Zhang ، Jianshu Chen ، Dong Yu
ARXIV - أغسطس 2023 [ورقة]

RARR: البحث ومراجعة ما تقوله نماذج اللغة ، باستخدام نماذج اللغة
Luyu Gao ، Zhuyun Dai ، Panupong Pasupat ، Anthony Chen ، Arun Tejasvi Chaganty ، Yicheng Fan ، Vincent Zhao ، Ni Lao ، Hongrae Lee ، Da-Cheng Juan ، Kelvin Guu
ACL 2023 - يوليو 2023 [ورقة]

التحقق والمحرر: إطار عمل يعزز المعرفة
Ruochen Zhao ، Xingxuan Li ، Shafiq Joty ، Chengwei Qin ، Lidong Bing
ACL 2023 - يوليو 2023 [ورقة]

الجيل المعزز للاسترجاع النشط
Zhengbao Jiang ، Frank F. Xu ، Luyu Gao ، Zhiqing Sun ، Qian Liu ، Jane Dwivedi-Yu ، Yiming Yang ، Jamie Callan ، Graham Neubig
ARXIV - مايو 2023 [ورقة] [رمز]

تحسين نماذج اللغة من خلال ردود الفعل في استرجاع التوصيل والتشغيل
Wenhao Yu ، Zhihan Zhang ، Zhenwen Liang ، Meng Jiang ، Ashish Sabharwal
ARXIV - مايو 2023 [ورقة]

تقديرات عدم اليقين حقيقة

المعايرة اللغوية للأجيال الطويلة
نيل باند ، Xuechen LI ، Tengyu MA ، Tatsunori Hashimoto
Arxiv 2024 - يونيو 2024 [ورقة]

أن تصدق أو لا تصدق LLM الخاص بك
ياسين عباسي يادكوري ، إيلجا كوزبورسكيج ، أندراس جيورجي ، سيسابا سزيبسفري
Arxiv 2024 - يونيو 2024 [ورقة]

يقول: تعليم LLMS للتعبير
Tianyang Xu ، Shujin Wu ، Shizhe Dioo ، Xiaoze Liu ، Xingyao Wang ، Yangyi Chen ، Jing Gao
Arxiv 2024 - May 2024 [Paper]

الخبراء لا يغشون: تعلم ما لا تعرفه بالتنبؤ بالأزواج
دانييل دي جونسون ، دانييل تارلو ، ديفيد دوفينو ، كريس ج. ماديسون
Arxiv 2024 - فبراير 2024 [ورقة]

جيل مقيد

فتح توليد النص الاستباقي: نهج مقيد لفك تشفير المؤمنين مع نماذج اللغة الكبيرة
مجهول
ICLR 24 - أكتوبر 2023 [ورقة]

دولا: فك تشفير الطبقات المتناقضة يحسن الواقعية في نماذج اللغة الكبيرة
Yung-Sung Chuang ، Yujia Xie ، Hongyin Luo ، Yoon Kim ، James Glass ، Pengcheng HE
ICLR 24 - سبتمبر 2023 [ورقة]

تركز البيانات

نهج يركز على البيانات لتوليد ملخصات المريض المؤمنة وعالية الجودة مع نماذج لغة كبيرة
ستيفان هيغسلان ، شانون زيجيانغ شين ، فلوريان جيرسي ، مونيكا أغراوال ، ديفيد سونتاج ، شياووي جيانغ
Arxiv 24 - فبراير 2024 [ورقة]

تعظيم المنفعة

خرقة ستوكاستيك: الجيل المتمثل في استرجاع من شامل إلى النهاية من خلال تعظيم المنفعة المتوقعة
حامد زاماني ، مايكل بيندرسكي
Arxiv 24 - May 2024 [Paper]

الذكاء الاصطناعي الدستوري: إلحاق الضرر من ردود الفعل من الذكاء الاصطناعي
Yuntao Bai ، Saurav Kadavath ، Sandipan Kundu ، Amanda Askell ، Jackson Kernion ، Andy Jones ، Anna Chen ، Anna Goldie ، Azalia Mirhoseini ، Cameron McKinon ، Carol Chen ، Catherine Olsson ، Christopher Olah ، Danny Hernande ، Dawn Prain ، Dawn. بيريز ، جيمي كير ، جاريد مولر ، جيفري لاديش ، جوشوا لانداو ، كمال ندوسي ، كاميل لوكوسيوت ، ليان لوفيت ، مايكل سيليتو ، نيلسون إلهاج ، نيكولاس شييفر ، نويمي ميركادو ، نوفا داسارما ، روبرت لاسينبي ، روبن لارينج Showk ، Stanislav Fort ، Tamera Lanham ، Timothy Telleen-Lawton ، Tom Conerly ، Tom Henighan ، Tristan Hume ، Samuel R. Bowman ، Zac Hatfield-Dodds ، Ben Mann ، Dario Amodei ، Nicholas Joseph ، Sam McCandlish ، Tom Brown ، Jared Kaplan Anypic.com-Decper 2022 []

تعلم مهارات جديدة بعد النشر: تحسين الحوار الذي يحركه الإنترنت مع ردود الفعل البشرية
جينغ شو ، ميغان أونج ، موجتابا كوميلي ، كوشال أرورا ، يان لان بورو ، جيسون ويستون
ARXIV - أغسطس 2022 [ورقة]

متعدد الوسائط

نمذجة اللغة متعددة الوسائط المتمحورة للاسترجاع
Michihiro Yasunaga ، أرمين Aghajanyan ، Weijia Shi ، Rich James ، Jure Leskovec ، Percy Liang ، Mike Lewis ، Luke Zettlemoyer ، Wen-Tau Yih
ARXIV - نوفمبر 2022 [ورقة]

رام: أسئلة بصرية طبية حيوية استرجاع
Zheng Yuan ، Qiao Jin ، Chuanqi Tan ، Zhengyun Zhao ، Hongyi Yuan ، Fei Huang ، Songfang Huang
Arxiv - مارس 2023 [ورقة]

المطالبة

الاسترجاع المتداخل مع التفكير في سلسلة أفكار للأسئلة متعددة الخطوات كثيفة المعرفة هارش تريفيدي ، نيرانجان بالاسوبرامانيان ، توشر خوت وآشيش ساباروال ACL 23-يوليو 2023 [ورقة]

رد فعل: تآزر التفكير والتمثيل في نماذج اللغة
Shunyu Yao ، Jeffrey Zhao ، Dian Yu ، Nan Du ، Izhak Shafran ، Karthik Narasimhan ، Yuan Cao
ARXIV - أكتوبر 2022 [ورقة]

إنشاء رمز

repocoder: إكمال رمز مستوى المستودع من خلال استرجاع وتوليد التكرار
Fengji Zhang ، Bei Chen ، Yue Zhang ، Jin Liu ، Daoguang Zan ، Yi Mao ، Jian-Guang Lou ، Weizhu Chen
Arxiv - مارس 2023 [ورقة]

الوثائق: إنشاء رمز عن طريق استرداد المستندات
Shuyan Zhou ، Uri Alon ، Frank F. Xu ، Zhiruo Wang ، Zhengbao Jiang ، Graham Neubig
ICLR 23 - يوليو 2022 [ورقة] [رمز] [بيانات]

جيل الاستعلام

توليد وتصفية وفتيل: توسيع الاستعلام عن طريق توليد الكلمات الرئيسية متعددة الخطوات لمرورات عصبية صفرية
Minghan Li ، Honglei Zhuang ، Kai Hui ، Zhen Qin ، Jimmy Lin ، Rolf Jagerman ، Xuanhui Wang ، Michael Bendersky
ARXIV - نوفمبر 2023 [ورقة]

Agent4Ranking: الترتيب الدلالي القوي عبر إعادة كتابة الاستعلام المخصصة باستخدام Multi-Agent LLM
Xiaopeng Li ، Lixin SU ، Pengyue Jia ، Xiangyu Zhao ، Suqi Cheng ، Junfeng Wang ، Dawei Yin
ARXIV - ديسمبر 2023 [ورقة]

استرجاع توليدي وكثيف لإعادة كتابة الاستعلام في البحث برعاية
أكاش كومار موهانكومار ، بهارجاف دودلا ، غوروراج ك ، أميت سينغ
Arxiv - سبتمبر 2022 [ورقة]

التلخيص وإعادة كتابة المستندات

يولد توليد الرياضة المتسقة من الناحية الواقعية الروايات
Noah Sarfati ، Ido Yerushalmy ، Michael Chertok ، Yosi Keller
MMSPorts 2023 - 23 أكتوبر [ورقة]

استرجاع المعلومات الوراثية
Hrishikesh Kulkarni ، Zachary Young ، Nazli Goharian ، Ophir Frieder ، Sean Macavaney
Doceng 23 - 23 أغسطس [ورقة]

تعلم تلخيص التعليقات البشرية
Nisan Stiennon ، Long Ouyang ، Jeff Wu ، Daniel M. Ziegler ، Ryan Lowe ، Chelsea Voss ، Alec Radford ، Dario Amodei ، Paul Christiano
Neups 2020 - سبتمبر 2020 [ورقة]

On Faithfulness and Factuality in Abstractive Summarization
Joshua Maynez, Shashi Narayan, Bernd Bohnet, Ryan McDonald
ACL 2020 – May 2020 [paper]

Table QA

Augment before You Try: Knowledge-Enhanced Table Question Answering via Table Expansion
Yujian Liu, Jiabao Ji, Tong Yu, Ryan Rossi, Sungchul Kim, Handong Zhao, Ritwik Sinha, Yang Zhang, Shiyu Chang
arXiv – Jan 2024 [paper]

Generative Document Retrieval

We jump-started this section by reusing the content of awesome-generative-retrieval-models and give full credit to Chriskuei for that! We now have added some content on top.

Generate a Document ID as an identifier

De-DSI: Decentralised Differentiable Search Index
Petru Neague, Marcel Gregoriadis, Johan Pouwelse
EuroMLSys 24 – Apr 2024 [paper]

Listwise Generative Retrieval Models via a Sequential Learning Process
Yubao Tang, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Wei Chen, Xueqi Cheng
TOIS 2024 – Mar 2024 [Paper]

Distillation Enhanced Generative Retrieval
Yongqi Li, Zhen Zhang, Wenjie Wang, Liqiang Nie, Wenjie Li, Tat-Seng Chua
arXiv 2024 – Feb 2024 [Paper]

Self-Retrieval: Building an Information Retrieval System with One Large Language Model
Qiaoyu Tang, Jiawei Chen, Bowen Yu, Yaojie Lu, Cheng Fu, Haiyang Yu, Hongyu Lin, Fei Huang, Ben He, Xianpei Han, Le Sun, Yongbin Li
arXiv 2024 – Feb 2024 [Paper]

Generative Dense Retrieval: Memory Can Be a Burden
Peiwen Yuan, Xinglin Wang, Shaoxiong Feng, Boyuan Pan, Yiwei Li, Heda Wang, Xupeng Miao, Kan Li
EACL 2024 - Jan 2024 [paper] [code]

Auto Search Indexer for End-to-End Document Retrieval
Tianchi Yang, Minghui Song, Zihan Zhang, Haizhen Huang, Weiwei Deng, Feng Sun, Qi Zhang
EMNLP 2023 - December 23 [paper]

DiffusionRet: Diffusion-Enhanced Generative Retriever using Constrained Decoding
Shanbao Qiao, Xuebing Liu, Seung-Hoon Na
EMNLP Findings 2023 – Dec 2023 [paper]

Scalable and Effective Generative Information Retrieval
Hansi Zeng, Chen Luo, Bowen Jin, Sheikh Muhammad Sarwar, Tianxin Wei, Hamed Zamani
WWW 2024 - Nov 2023 [paper] [code]

Nonparametric Decoding for Generative Retrieval
Hyunji Lee, JaeYoung Kim, Hoyeon Chang, Hanseok Oh, Sohee Yang, Vladimir Karpukhin, Yi Lu, Minjoon Seo
ACL Findings 2023 – Jul 2023 [paper]

Model-enhanced Vector Index
Hailin Zhang, Yujing Wang, Qi Chen, Ruiheng Chang, Ting Zhang, Ziming Miao, Yingyan Hou, Yang Ding, Xupeng Miao, Haonan Wang, Bochen Pang, Yuefeng Zhan, Hao Sun, Weiwei Deng, Qi Zhang, Fan Yang, Xing Xie, Mao Yang, Bin Cui
NeurIPS 2023 – May 2023 [paper] [code]

Continual Learning for Generative Retrieval over Dynamic Corpora
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Wei Chen, Yixing Fan, Xueqi Cheng
CIKM 2023 - Aug 2023 [paper]

Learning to Rank in Generative Retrieval
Yongqi Li, Nan Yang, Liang Wang, Furu Wei, Wenjie Li
arXiv – Jun 2023 [paper]

Large Language Models are Built-in Autoregressive Search Engines
Noah Ziems, Wenhao Yu, Zhihan Zhang, Meng Jiang
ACL Findings 2023 – May 2023 [paper]

Multiview Identifiers Enhanced Generative Retrieval
Yongqi Li, Nan Yang, Liang Wang, Furu Wei, Wenjie Li
ACL 2023 – May 2023 [paper]

How Does Generative Retrieval Scale to Millions of Passages?
Ronak Pradeep, Kai Hui, Jai Gupta, Adam D. Lelkes, Honglei Zhuang, Jimmy Lin, Donald Metzler, Vinh Q. Tran
arXiv – May 2023 [paper]

TOME: A Two-stage Approach for Model-based Retrieval
Ruiyang Ren, Wayne Xin Zhao, Jing Liu, Hua Wu, Ji-Rong Wen, Haifeng Wang
ACL 2023 - May 2023 [paper]

Understanding Differential Search Index for Text Retrieval
Xiaoyang Chen, Yanjiang Liu, Ben He, Le Sun, Yingfei Sun
ACL Findings 2023 - May 2023 [paper]

Learning to Tokenize for Generative Retrieval
Weiwei Sun, Lingyong Yan, Zheng Chen, Shuaiqiang Wang, Haichao Zhu, Pengjie Ren, Zhumin Chen, Dawei Yin, Maarten de Rijke, Zhaochun Ren
arXiv – Apr 2023 [paper]

DynamicRetriever: A Pre-trained Model-based IR System Without an Explicit Index
Yu-Jia Zhou, Jing Yao, Zhi-Cheng Dou, Ledell Wu, Ji-Rong Wen
Machine Intelligence Research – Jan 2023 [paper]

DSI++: Updating Transformer Memory with New Documents
Sanket Vaibhav Mehta, Jai Gupta, Yi Tay, Mostafa Dehghani, Vinh Q. Tran, Jinfeng Rao, Marc Najork, Emma Strubell, Donald Metzler
arXiv – Dec 2022 [paper]

CodeDSI: Differentiable Code Search
Usama Nadeem, Noah Ziems, Shaoen Wu
arXiv – Oct 2022 [paper]

Contextualized Generative Retrieval
Hyunji Lee, Jaeyoung Kim, Hoyeon Chang, Hanseok Oh, Sohee Yang, Vlad Karpukhin, Yi Lu, Minjoon Seo
arXiv – Oct 2022 [paper]

Transformer Memory as a Differentiable Search Index
Yi Tay, Vinh Q. Tran, Mostafa Dehghani, Jianmo Ni, Dara Bahri, Harsh Mehta, Zhen Qin, Kai Hui, Zhe Zhao, Jai Gupta, Tal Schuster, William W. Cohen, Donald Metzler
Neurips 2022 – Oct 2022 [paper] [Video] [third-party code]

A Neural Corpus Indexer for Document Retrieval
Wang et al.
Arxiv 2022 [paper]

Bridging the Gap Between Indexing and Retrieval for Differentiable Search Index with Query Generation
Shengyao Zhuang, Houxing Ren, Linjun Shou, Jian Pei, Ming Gong, Guido Zuccon, and Daxin Jiang
Arxiv 2022 [paper] [Code]

DynamicRetriever: A Pre-training Model-based IR System with Neither Sparse nor Dense Index
Zhou et al
Arxiv 2022 [paper]

Ultron: An Ultimate Retriever on Corpus with a Model-based Indexer
Zhou et al
Arxiv 2022 [paper]

Generate a string as an identifier

Planning Ahead in Generative Retrieval: Guiding Autoregressive Generation through Simultaneous Decoding
Hansi Zeng ,Chen Luo ,Hamed Zamani
arXiv – Apr 2024 [paper] [Code]

NOVO: Learnable and Interpretable Document Identifiers for Model-Based IR
Zihan Wang, Yujia Zhou, Yiteng Tu, Zhicheng Dou
CIKM 2023 - October 2023 [paper]

Generative Retrieval as Multi-Vector Dense Retrieval
Shiguang Wu, Wenda Wei, Mengqi Zhang, Zhumin Chen, Jun Ma, Zhaochun Ren, Maarten de Rijke, Pengjie Ren
SIGIR 2024 - March 24 [paper] [Code]

Re3val: Reinforced and Reranked Generative Retrieval
EuiYul Song, Sangryul Kim, Haeju Lee, Joonkee Kim, James Thorne
EACL Findings 2023 – Jan 24 [paper]

GLEN: Generative Retrieval via Lexical Index Learning
Sunkyung Lee, Minjin Choi, Jongwuk Lee
EMNLP 2023 - December 23 [paper] [Code]

Enhancing Generative Retrieval with Reinforcement Learning from Relevance Feedback
Yujia Zhou, Zhicheng Dou, Ji-Rong Wen
EMNLP 2023 - December 23 [paper]

Generative Retrieval with Large Language Models
مجهول
ICLR 24 – October 23 [paper]

Semantic-Enhanced Differentiable Search Index Inspired by Learning Strategies
Yubao Tang, Ruqing Zhang, Jiafeng Guo, Jiangui Chen, Zuowei Zhu, Shuaiqiang Wang, Dawei Yin, Xueqi Cheng
KDD 2023 – May 2023 [paper]

Term-Sets Can Be Strong Document Identifiers For Auto-Regressive Search Engines
Peitian Zhang, Zheng Liu, Yujia Zhou, Zhicheng Dou, Zhao Cao
arXiv – May 2023 [paper] [Code]

A Unified Generative Retriever for Knowledge-Intensive Language Tasks via Prompt Learning
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Yiqun Liu, Yixing Fan, Xueqi Cheng
SIGIR 2023 – Apr 2023 [paper] [Code]

CorpusBrain: Pre-train a Generative Retrieval Model for Knowledge-Intensive Language Tasks
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Yiqun Liu, Yixing Fan, Xueqi Cheng
CIKM 2022 – Aug 2022 [paper] [Code]

Autoregressive Search Engines: Generating Substrings as Document Identifiers
Michele Bevilacqua, Giuseppe Ottaviano, Patrick Lewis, Wen-tau Yih, Sebastian Riedel, Fabio Petroni
arXiv – Apr 2022 [paper] [Code]

Autoregressive Entity Retrieval
Nicola De Cao, Gautier Izacard, Sebastian Riedel, Fabio Petroni
ICLR 2021 – Oct 2020 [paper] [Code]

التطبيقات

Data-Efficient Autoregressive Document Retrieval for Fact Verification
James Thorne
SustaiNLP@EMNLP 2022 – Nov 2022 [paper]

GERE: Generative Evidence Retrieval for Fact Verification
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Yixing Fan, Xueqi Cheng
SIGIR 2022 [paper] [Code]

Generative Multi-hop Retrieval
Hyunji Lee, Sohee Yang, Hanseok Oh, Minjoon Seo
arXiv – Apr 2022 [paper]

Generative Recommendation

Improving LLMs for Recommendation with Out-Of-Vocabulary Tokens
Ting-Ji Huang, Jia-Qi Yang, Chunxu Shen, Kai-Qi Liu, De-Chuan Zhan, Han-Jia Ye
arXiv – Jun 2024 [paper]

Plug-in Diffusion Model for Sequential Recommendation
Haokai Ma, Ruobing Xie, Lei Meng, Xin Chen, Xu Zhang, Leyu Lin, Zhanhui Kang
arXiv – Jan 2024 [paper]

Towards Graph-Aware Diffusion Modeling For Collaborative Filtering Yunqin Zhu1, Chao Wang, Hui Xiong
arXiv – Nov 2023 [paper]

RecMind: Large Language Model Powered Agent For Recommendation
Yancheng Wang, Ziyan Jiang, Zheng Chen, Fan Yang, Yingxue Zhou, Eunah Cho, Xing Fan, Xiaojiang Huang, Yanbin Lu, Yingzhen Yang
arXiv – Aug 2023 [paper]

Is ChatGPT Fair for Recommendation? Evaluating Fairness in Large Language Model Recommendation
Jizhi Zhang, Keqin Bao, Yang Zhang, Wenjie Wang, Fuli Feng, Xiangnan He
Recsys 2023 – Jul 2023 [paper]

RecFusion: A Binomial Diffusion Process for 1D Data for Recommendation
Gabriel Bénédict, Olivier Jeunen, Samuele Papa, Samarth Bhargav, Daan Odijk, Maarten de Rijke
arXiv – Jun 2023 [paper]

A First Look at LLM-Powered Generative News Recommendation
Qijiong Liu, Nuo Chen, Tetsuya Sakai, Xiao-Ming Wu
arXiv – Jun 2023 [paper]

Large Language Models as Zero-Shot Conversational Recommenders
Yupeng Hou, Junjie Zhang, Zihan Lin, Hongyu Lu, Ruobing Xie, Julian McAuley, Wayne Xin Zhao
arXiv – May 2023 [paper]

DiffuRec: A Diffusion Model for Sequential Recommendation
Zihao Li, Aixin Sun, Chenliang Li
arXiv – Apr 2023 [paper]

Diffusion Recommender Model
Wenjie Wang, Yiyan Xu, Fuli Feng, Xinyu Lin, Xiangnan He, Tat-Seng Chua
SIGIR 2023 – Apr 2023 [paper]

Blurring-Sharpening Process Models for Collaborative Filtering
Jeongwhan Choi, Seoyoung Hong, Noseong Park, Sung-Bae Cho
SIGIR 2023 – Apr 2023 [paper] [code]

Recommender Systems with Generative Retrieval
Shashank Rajput, Nikhil Mehta, Anima Singh, Raghunandan Keshavan, Trung Vu, Lukasz Heldt, Lichan Hong, Yi Tay, Vinh Q. Tran, Jonah Samost, Maciej Kula, Ed H. Chi, Maheswaran Sathiamoorthy
non-archival – Mar 2023 [paper]

Pre-train, Prompt and Recommendation: A Comprehensive Survey of Language Modelling Paradigm Adaptations in Recommender Systems
Peng Liu, Lemei Zhang, Jon Atle Gulla
arXiv – Feb 2023 [paper]

Generative Slate Recommendation with Reinforcement Learning
Romain Deffayet, Thibaut Thonet, Jean-Michel Renders, and Maarten de Rijke
WSDM 2023 – Feb 2023 [paper]

Recommendation via Collaborative Diffusion Generative Model
Joojo Walker, Ting Zhong, Fengli Zhang, Qiang Gao, Fan Zhou
KSEM 2022 – Aug 2022 [paper]

Generative Knowledge Graphs

DocGraphLM: Documental Graph Language Model for Information Extraction
Dongsheng Wang, Zhiqiang Ma, Armineh Nourbakhsh, Kang Gu, Sameena Shah
arXiv – Jan 2024 [paper]

KBFormer: A Diffusion Model for Structured Entity Completion
Ouail Kitouni, Niklas Nolte, James Hensman, Bhaskar Mitra
arXiv – Dec 2023 [paper]

From Retrieval to Generation: Efficient and Effective Entity Set Expansion
Shulin Huang, Shirong Ma, Yangning Li, Yinghui Li, Hai-Tao Zheng, Yong Jiang
arXiv – Apr 2023 [paper]

Crawling the Internal Knowledge-Base of Language Models
Roi Cohen, Mor Geva, Jonathan Berant, Amir Globerson
arXiv – Jan 2023 [paper]

Prompt Tuning or Fine-Tuning - Investigating Relational Knowledge in Pre-Trained Language Models
Leandra Fichtel, Jan-Christoph Kalo, Wolf-Tilo Balke
AKBC 2021 – [paper]

نماذج اللغة كقواعد المعرفة؟
Fabio Petroni, Tim Rocktäschel, Patrick Lewis, Anton Bakhtin, Yuxiang Wu, Alexander H. Miller, Sebastian Riedel
EMNLP 2019 – Sep 2019 [paper]

Live Generative Retrieval

Although some of these are not accompanied by a paper, they might be useful to other Generative IR researchers for empirical studies or interface design considerations.

⚡ Gemini Dec 2023 [live] ⚡️ factiverse Jun 2023 [live] ⚡️ devmarizer Mar 2023 [live] ⚡️ TaxGenius Mar 2023 [live] ⚡️ doc-gpt Mar 2023 [live] ⚡️ book-gpt Feb 2023 [live] ⚡️ Neeva Feb 2023 [live] ⚡️ Golden Retriever Feb 2023 [live] ⚡️ Bing – Prometheus Feb 2023 [waitlist] ⚡️ Google – Bard Feb 2023 [only in certain countries] ⚡️ Paper QA Feb 2023 [code] [demo] ⚡️ DocsGPT Feb 2023 [live] [code] ⚡️ DocAsker Jan 2023 [live] ⚡️ Lexii.ai Jan 2023 [live] ⚡️ YOU.com Dec 2022 [live] ⚡️ arXivGPT Dec 2022 [Chrome extension] ⚡️ GPT Index Nov 2022 [API] ⚡️ BlenderBot Aug 2022 [live (USA)] [model weights] [code] [paper1] [paper2] ⚡️ PHIND date? [live] ⚡️ Perplexity date? [live] ⚡️ Galactica date? [demo] [API] [paper] ⚡️ Elicit date? [live] ⚡️ ZetaAlpha date? [live] uses OpenAI API

To get just the paper titles do grep '**' README.md | sed 's/**//g'

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-02-28
الحجم 21.43KB
من Github

تطبيقات ذات صلة

awesome citygml

2024-11-13
awesome generative ai guide

2024-11-05
awesome swift

2024-11-03
Retrieval based Voice Conversion WebUI

2024-11-01
لعبة معلومات الشخص المشبوه النسخة الصينية

2024-07-20
الإعلان الرائع

2022-08-08

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

شفرة المصدر الأخرى

1.0.0
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

شفرة المصدر الأخرى

1.0.0

أخبار ذات صلة الكل