โมเดลการสนทนาเริ่มสามารถเข้าถึงเว็บหรือสำรองข้อมูลการเรียกร้องของพวกเขาด้วยแหล่งที่มา (aka แหล่งที่มา) chatbots เหล่านี้จึงเป็นเครื่องดึงข้อมูลข้อมูลการแข่งขันกับหรือแม้แต่แทนที่เครื่องมือค้นหาแบบดั้งเดิม เราต้องการอุทิศพื้นที่ให้กับโมเดลเหล่านี้ แต่ยังรวมถึงสาขาทั่วไปของการดึงข้อมูลทั่วไป เรากำจัดสนามในสองหัวข้อหลัก: การสร้างคำตอบที่ต่อสายดิน และ การดึงเอกสารทั่วไป นอกจากนี้เรายังรวมถึงคำแนะนำการกำเนิดการสรุปพื้นฐานแบบกำเนิด ฯลฯ
ยินดีต้อนรับดึงคำตอบ!
การอ้างอิงที่กำหนด: การทำให้ LLMS ปลอดภัยสำหรับการดูแลสุขภาพ
Matt Yeung
บล็อกส่วนบุคคล - เม.ย. 2024 [ลิงก์]
Retrieval Augmented Generation Research: 2017-2024
Moritz Mallawitsch
ความรู้การปรับขนาด - ก.พ. 2024 [ลิงก์]
Mastering Rag: วิธีการสถาปัตยกรรมระบบผ้าขี้ริ้วขององค์กร
Pratik Bhavsar
Galileo Labs - ม.ค. 2024 [ลิงก์]
รัน Mixtral 8x7 ในพื้นที่ด้วย llamaidex
llamainedex
บล็อก llamaidex - ธ.ค. 2023 [ลิงก์]
เทคนิค RAG ขั้นสูง: ภาพรวมภาพประกอบ
อีวานอิลิน
สู่ AI - Dec 2023 [ลิงก์]
ไปป์ไลน์ผ้าขี้ริ้วหลายรูป
Tomaz Bratanic
บล็อก llamaidex - ธ.ค. 2023 [ลิงก์]
การเปรียบเทียบผ้าขี้ริ้วบนโต๊ะ
คนขี้เกียจ
บล็อก Langchain - ธ.ค. 2023 [ลิงก์]
RAG ขั้นสูง 01: การดึงข้อมูลขนาดเล็กถึงบิ๊ก
โซเฟียหยาง
สู่วิทยาศาสตร์ข้อมูล - พ.ย. 2023 [ลิงก์]
การเปลี่ยนแปลงแบบสอบถาม
คนขี้เกียจ
บล็อก Langchain - ต.ค. 2023 [ลิงก์]
อะไรทำให้ตัวแทนโต้ตอบมีประโยชน์?
Nazneen Rajani, Nathan Lambert, Victor Sanh, Thomas Wolf
Hugging Face Blog - ม.ค. 2023 [ลิงก์]
การคาดการณ์การใช้แบบจำลองภาษาที่อาจเกิดขึ้นในทางที่ผิดสำหรับแคมเปญที่บิดเบือนและวิธีลดความเสี่ยง
Josh A. Goldstein, Girish Sastry, Micah Musser, Renée Diresta, Matthew Gentzel, Katerina Sedova
Openai Blog - Jan 2023 [ลิงก์]
ความจริงการดึงและเหตุผล: การประเมินผลรวมของการค้นคืนแบบ สมาร์ยาปาริยากฤษณะ, Kalpesh Krishna, Anhad Mohananey, Steven Schwarcz, Adam Stambler, Shyam Upadhyay, Manaal Faruqui Arxiv-Sep 2024
Litsearch: มาตรฐานการดึงข้อมูลสำหรับการค้นหาวรรณกรรมทางวิทยาศาสตร์
Anirudh Ajith, Mengzhou Xia, Alexis Chevalier, Tanya Goyal, Danqi Chen, Tianyu Gao
arxiv - ก.ค. 2023 [กระดาษ] [ข้อมูล]
Bright: เกณฑ์มาตรฐานที่สมจริงและท้าทายสำหรับการดึงข้อมูลที่ใช้เหตุผลอย่างเข้มข้น
Hongjin Su, Howard Yen, Mengzhou Xia, Weijia Shi, Niklas Muennighoff, Han-Yu Wang, Haisu Liu, Quan Shi, Zachary S. Siegel, Michael Tang, Ruoxi Sun, Jinsung Yoon, Sercan O. Arik, Danqi Chen, Tao Yu
arxiv - ต.ค. 2023 [กระดาษ] [ข้อมูล] [รหัส]
Freshllms: สดชื่นแบบจำลองภาษาขนาดใหญ่พร้อมการเสริมเครื่องมือค้นหา
Tu Vu, Mohit Iyyer, Xuezhi Wang, Noah Constant, Jerry Wei, Jason Wei, Chris Tar, Yun-Hsuan Sung, Denny Zhou, Quoc Le, Thang Luong
arxiv - ต.ค. 2023 [กระดาษ] [รหัส]
LegalBench: มาตรฐานที่สร้างขึ้นร่วมกันสำหรับการวัดการให้เหตุผลทางกฎหมายในรูปแบบภาษาขนาดใหญ่
Neel Guha, Julian Nyarko, Daniel E. Ho, Christopher Ré, Adam Chilton, Aditya Narayana, Alex Chohlas-Wood, Austin Peters, Brandon Waldon, Daniel N. Rockmore, Diego Zambrano, Dmitry Talisman, Enam Hoque Porat, Jason Hegland, Jessica Wu, Joe Nudell, Joel Niklaus, John Nay, Jonathan H. Choi, Kevin Tobia, Margaret Hagan, Megan Ma, Michael Livermore, Nikon Rasumov-Rahe วิลเลียมส์, ซันนี่คานธี, ทอมซูร์, Varun Iyer, Zehua Li
arxiv - ส.ค. 2023 [กระดาษ] [ชุดข้อมูล]
การสนทนาแบบ openAssistant - การจัดแนวโมเดลภาษาขนาดใหญ่ที่เป็นประชาธิปไตย
Andreas Köpf, Yannic Kilcher, Dimitri von Rütte, Sotiris Anagnostidis, Zhi-Rui Tam, Keith Stevens, Abdullah Barhoum, Nguyen Minh Duc, Oliver Stanley, Richárd Nagyfi Christoph Schuhmann, Huu Nguyen, Alexander Mattick
arxiv - เมษายน 2023 [กระดาษ]
chatgpt-retrievalqa
Arian Askari, Mohammad Aliannejadi, Evangelos Kanoulas, Suzan Verberne
GitHub - ก.พ. 2023 [รหัส]
Kamel: การวิเคราะห์ความรู้ด้วยเอนทิตีหลายคนในรูปแบบภาษา
Jan-Christoph Kalo, Leandra Fichtel
AKBC 22 - [กระดาษ]
Trustfulqa: การวัดว่าแบบจำลองเลียนแบบความเท็จของมนุษย์อย่างไร
Stephanie Lin, Jacob Hilton, Owain Evans
arxiv - ก.ย. 2021 [กระดาษ] [รหัส]
การดึงคำตอบที่ซับซ้อน
Laura Dietz, Manisha Verma, Filip Radlinski, Nick Craswell, Ben Gamari, Jeff Dalton, John Foley
TREC-2017-2019 [ลิงก์]
Graphrag
Jonathan Larson, Steven Truitt
Microsoft - ก.พ. 2024 [รหัส]
การ จำกัด ช่องว่างการประเมินความรู้: การตอบคำถามแบบเปิดโดเมนด้วยคำตอบหลายระดับเสียง
Gal Yona, Roee Aharoni, Mor Geva
arxiv - ม.ค. 2024 [กระดาษ]
DHS LLM Workshop - โมดูล 6
sourab mangulkar
GitHub - ธ.ค. 2023 [รหัส]
PrimeQa: ที่เก็บข้อมูลสำคัญสำหรับคำถามหลายภาษาที่ทันสมัยตอบการวิจัยและพัฒนา
Avirup Sil, Jaydeep Sen, Bhavani Iyer, Martin Franz, Kshitij Fadnis, Mihaela Bornea, Sara Rosenthal, Scott McCarley, Rong Zhang, Vishwajeet Kumar, Yulong Li, Md Arafat Sultan
arxiv - ม.ค. 2023 [กระดาษ] [รหัส]
TRL: การเรียนรู้การเสริมแรงของหม้อแปลง
Leandro von Werra, Younes Belkada, Lewis Tunstall, Edward Beeching, Tristan Thrush, Nathan Lambert, Shengyi Huang
GitHub - 2020 [รหัส]
FACTSCORE: การประเมินอะตอมที่ละเอียดของความแม่นยำจริงในการสร้างข้อความแบบยาว
Sewon Min, Kalpesh Krishna, Xinxi Lyu, Mike Lewis, Wen-Tau Yih, Pang Wei Koh, Mohit Iyyer, Luke Zettlemoyer, Hannaneh Hajishirzi
PYPI - พฤษภาคม 2023 [กระดาษ] [รหัส]
FactKB: การประเมินความเป็นจริงทั่วไปโดยใช้แบบจำลองภาษาที่ปรับปรุงด้วยความรู้จริง
Shangbin Feng, Vidhisha Balachandran, Yuyang Bai, Yulia Tsvetkov
arxiv - พฤษภาคม 2023 [กระดาษ] [รหัส]
การประเมินความสามารถในการตรวจสอบในเครื่องมือค้นหาทั่วไป
Nelson F. Liu, Tianyi Zhang, Percy Liang
arxiv - เมษายน 2023 [กระดาษ] [รหัส]
เวิร์กช็อปเกี่ยวกับการกำเนิด AI สำหรับระบบผู้แนะนำและการปรับเปลี่ยน
Narges Tabari, Aniket Deshmukh, Wang-Cheng Kang, Rashmi Gangadharaiah, Hamed Zamani, Julian McAuley, George Karypis
KDD 24 - ส.ค. 2024 [ลิงก์]
การประชุมเชิงปฏิบัติการครั้งที่สองเกี่ยวกับการดึงข้อมูลกำเนิดข้อมูล
Gabriel Bénédict, Ruqing Zhang, Donald Metzler, Andrew Yates, Ziyan Jiang
SIGIR 24 - ก.ค. 2024 [ลิงก์]
AI Generative Generative
Zheng Chen, Ziyan Jiang, Fan Yang, Zhankui HE, Yupeng Hou, Eunah Cho, Julian McAuley, Aram Galstyan, Xiaohua Hu, Jie Yang
CIKM 23 - ต.ค. 2023 [ลิงก์]
การประชุมเชิงปฏิบัติการครั้งแรกเกี่ยวกับคำแนะนำกับรุ่น Generative
Wenjie Wang, Yong Liu, Yang Zhang, Weiwen Liu, Fuli Feng, Xiangnan HE, Aixin Sun
CIKM 23 - ต.ค. 2023 [ลิงก์]
การประชุมเชิงปฏิบัติการครั้งแรกเกี่ยวกับการดึงข้อมูลกำเนิดข้อมูล
Gabriel Bénédict, Ruqing Zhang, Donald Metzler
Sigir 23 - Jul 2023 [Link]
แบบจำลองภาษาและแอปพลิเคชันแบบดึงข้อมูล
Akari Asai, Sewon Min, Zexuan Zhong, Danqi Chen
ACL 23 - ก.ค. 2023 [ลิงก์]
การดึงข้อมูลตัวแทน
Weinan Zhang, Junwei Liao, Ning Li, Kounianhua Du
arxiv - ต.ค. 2024 [กระดาษ]
ท่อง, สร้างใหม่, จำ: การท่องจำใน LMS เป็นปรากฏการณ์หลายแง่มุม
USVSN Sai Prashanth, Alvin Deng, Kyle O'Brien, Jyothir SV, Mohammad Aflah Khan, Jaydeep Borkar, Christopher A. Choquette-Choo, Jacob Ray Fuehne, Stella Biderman, Tracy Ke, Katherine
arxiv - มิ.ย. 2024 [กระดาษ]
CHATGPT เป็นเรื่องไร้สาระ
Michael Townsen Hicks, James Humphries, Joe Slater
จริยธรรม INF Technol - มิ.ย. 2024 [กระดาษ]
ภาพหลอนของแบบจำลองภาษาขนาดใหญ่หลายรูปแบบ: การสำรวจ
Zechen Bai, Pichao Wang, Tianjun Xiao, Tong HE, Zongbo Han, Zheng Zhang, Mike Zheng Shou
arxiv - เม.ย. 2024 [กระดาษ]
จากการจับคู่ไปสู่รุ่น: การสำรวจการดึงข้อมูลทั่วไป
Xiaoxi Li, Jiajie Jin, Yujia Zhou, Yuyao Zhang, Peitian Zhang, Yutao Zhu และ Zhicheng Dou
arxiv - เม.ย. 2024 [กระดาษ]
ความรู้ที่ขัดแย้งกับ LLMS: การสำรวจ
Rongwu Xu, Zehan Qi, Cunxiang Wang, Hongru Wang, Yue Zhang, Wei Xu
arxiv - มี.ค. 2024 [กระดาษ]
รายงานการประชุมเชิงปฏิบัติการครั้งที่ 1 เกี่ยวกับการดึงข้อมูลกำเนิด (Gen-IR 2023) ที่ Sigir 2023
Gabriel Bénédict, Ruqing Zhang, Donald Metzler, Andrew Yates, Romain Deffayet, Philipp Hager, Sami Jullien
Sigir Forum - Dec 2023 [Paper]
รายงานการประชุมเชิงปฏิบัติการครั้งที่ 1 เกี่ยวกับงานที่เน้น IR ในยุคของการกำเนิด AI
Chirag Shah, Ryen W. White
Sigir Forum - Dec 2023 [Paper]
สู่การค้นหาและคำแนะนำทั่วไป: คำปราศรัยที่ Recsys 2023
Tat-Seng Chua
Sigir Forum - Dec 2023 [Paper]
โมเดลการค้นหาขนาดใหญ่: นิยามใหม่สแต็คการค้นหาในยุคของ LLMS
เหลียงวัง, น่านหยาง, Xiaolong Huang, Linjun Yang, Rangan Majumder, Furu Wei
Sigir Forum - Dec 2023 [Paper]
แบบจำลองภาษาขนาดใหญ่สำหรับการสกัดข้อมูลแบบกำเนิด: การสำรวจ
Derong Xu, Wei Chen, Wenjun Peng, Chao Zhang, Tong Xu, Xiangyu Zhao, Xian Wu, Yefeng Zheng
arxiv - ธ.ค. 2023 [กระดาษ]
การดึงข้อความหนาแน่นขึ้นอยู่กับแบบจำลองภาษาที่ผ่านการฝึกอบรม: การสำรวจ
Wayne Xin Zhao, Jing Liu, Ruiyang Ren, Ji-Rong Wen
Tois - Dec 2023 [กระดาษ]
รุ่น Retrieval-Augmented สำหรับแบบจำลองภาษาขนาดใหญ่: การสำรวจ
Yunfan Gao, Yun Xiong, Xinyu Gao, Kangxiang Jia, Jinliu Pan, Yuxi BI, Yi Dai, Jiawei Sun, Haofen Wang
arxiv - ธ.ค. 2023 [กระดาษ]
แบบจำลองภาษาที่สอบเทียบจะต้องมีภาพหลอน
Adam Tauman Kalai, Santosh S. Vempala
arxiv - พ.ย. 2023 [กระดาษ]
เพลงของ Siren ในมหาสมุทร AI: การสำรวจภาพหลอนในรูปแบบภาษาขนาดใหญ่
Yue Zhang, Yafu Li, Leyang Cui, เติ้ง Cai, Lemao Liu, Tingchen Fu, Xinting Huang, Enbo Zhao, Yu Zhang, Yulong Chen, Longyue Wang, Anh Tuan Luu, Wei Bi, Freda Shi, Shuming Shi
arxiv - ก.ย. 2023 [กระดาษ]
คำสัญญาที่ผิดพลาดในการเลียนแบบ LLMS ที่เป็นกรรมสิทธิ์
Arnav Gudibande, Eric Wallace, Charlie Snell, Xinyang Geng, Hao Liu, Pieter Abbeel, Sergey Levine, Dawn Song
arxiv - พฤษภาคม 2023 [กระดาษ]
คำแนะนำทั่วไป: ไปสู่กระบวนทัศน์ผู้แนะนำรุ่นต่อไป
Fengji Zhang, Bei Chen, Yue Zhang, Jin Liu, Daoguang Zan, Yi Mao, Jian-Guang Lou, Weizhu Chen
arxiv - เมษายน 2023 [กระดาษ]
แบบจำลองภาษาที่เพิ่มขึ้น: การสำรวจ
Grégoire Mialon, Roberto Dessì, Maria Lomeli, Christoforos Nalmpantis, Ram Pasunuru, Roberta Raideanu, Baptiste Rozière, Timo Schick, Jane Dwivedi-Yu, Asli Celikyilmaz, Edouard Grave, Yann Lecun
arxiv - ก.พ. 2023 [กระดาษ]
แบบจำลองภาษากำเนิดและการดำเนินงานที่มีอิทธิพลอัตโนมัติ: ภัยคุกคามที่เกิดขึ้นใหม่และการบรรเทาที่อาจเกิดขึ้น
Josh A. Goldstein, Girish Sastry, Micah Musser, Renee Diresta, Matthew Gentzel, Katerina Sedova
arxiv - ม.ค. 2023 [กระดาษ]
การค้นหาข้อมูลการสนทนา บทนำเกี่ยวกับการค้นหาการสนทนาคำแนะนำและการตอบคำถาม
Hamed Zamani, Johanne R. Trippas, Jeff Dalton และ Filip Radlinski
arxiv - ม.ค. 2023 [กระดาษ]
ข้อเท็จจริง
Kevin Mulligan และ Fabrice Correia
สารานุกรมสแตนฟอร์ดของปรัชญา - ฤดูหนาว 2021 [URL]
ความจริง AI: การพัฒนาและควบคุม AI ที่ไม่โกหก
Owain Evans, Owen Cotton-Barratt, Lukas Finnveden, Adam Bales, Avital Balwit, Peter Wills, Luca Righetti, William Saunders
arxiv - ต.ค. 2021 [กระดาษ]
ทบทวนการค้นหา: ทำให้ผู้เชี่ยวชาญโดเมนออกจาก dilettantes
Donald Metzler, Yi Tay, Dara Bahri, Marc Najork
Sigir Forum 2021 - พฤษภาคม 2021 [กระดาษ]
การตอบคำถามที่ระบุ: การประเมินผลและการสร้างแบบจำลองสำหรับแบบจำลองภาษาขนาดใหญ่ที่นำมาประกอบ
Bernd Bohnet, Vinh Q. Tran, Pat Verga, Roee Aharoni, Daniel Andor, Livio Baldini Soares, Jacob Eisenstein, Kuzman Ganchev, Jonathan Herzig, Kai Hui, Tom Kwiatkowski Donald Metzler, Slav Petrov, Kellie Webster
arxiv - ธ.ค. 2022 [กระดาษ]
การต่อสายดิน/การดึงข้อมูลภายนอกในเวลาอนุมาน
Raptor: การประมวลผลแบบนามธรรมแบบเรียกซ้ำสำหรับการดึงต้นไม้ที่จัดโดยต้นไม้
Parth Sarthi, Salman Abdullah, Aditi Tuli, Shubh Khanna, Anna Goldie, Christopher D. Manning
ICLR 24 - ม.ค. 2024 [กระดาษ]
การแก้ไขการเรียกคืนการแก้ไข
Shi-Qi Yan, Jia-Chen Gu, Yun Zhu, Zhen-Hua Ling
arxiv - ม.ค. 2024 [กระดาษ]
เกี่ยวกับเวลา: การผสมผสานชั่วคราวในรูปแบบภาษาที่เพิ่มขึ้น
Anoushka Gade, Jorjeta Jetcheva
arxiv - ม.ค. 2024 [กระดาษ]
ผ้าขี้ริ้วเทียบกับการปรับแต่ง: ท่อ, การแลกเปลี่ยนและกรณีศึกษาเกี่ยวกับการเกษตร
ทูตสวรรค์ Balaguer, Vinamra Benara, Renato Luiz de Freitas Cunha, Roberto de M. Estevão Filho, Todd Hendry, Daniel Holstein, Jennifer Marsman, Nick Mecklenburg, Sara Malvar, Leonardo O. Nunes, Rafael Padilha Ranveer Chandra
arxiv - ม.ค. 2024 [กระดาษ]
การเรียงลำดับma�tters: แบบจำลองการสร้างแบบจำลองแบบสร้างใหม่สำหรับการสร้างตัวแทนการสนทนา
Quinn Patwardhan, Grace Hui Yang
TREC 23 - พ.ย. 2023 [กระดาษ]
Rag-Rag: การเรียนรู้ที่จะเรียกคืนสร้างและวิจารณ์ผ่านการสะท้อนตนเอง
ไม่ระบุชื่อ
ICLR 24 - ต.ค. 2023 [กระดาษ]
RA-DIT: การปรับแต่งคำสั่งคู่แบบเรียกคืน
ไม่ระบุชื่อ
ICLR 24 - ต.ค. 2023 [กระดาษ]
การเรียนรู้ในบริบทด้วยโมเดลภาษาตัวเข้ารหัสแบบปรับแต่ง
ไม่ระบุชื่อ
ICLR 24 - ต.ค. 2023 [กระดาษ]
การทำให้แบบจำลองภาษาที่รอการดึงข้อมูลนั้นแข็งแกร่งต่อบริบทที่ไม่เกี่ยวข้อง
ไม่ระบุชื่อ
ICLR 24 - ต.ค. 2023 [กระดาษ]
การดึงข้อมูลเป็นไปตามรูปแบบภาษาขนาดใหญ่ที่ยาวนาน
ไม่ระบุชื่อ
ICLR 24 - ต.ค. 2023 [กระดาษ]
การปรับเปลี่ยนโดเมนการปรับตัวของแบบจำลองภาษาขนาดใหญ่เป็นการปรับตัวแบบปรับเปลี่ยน
ไม่ระบุชื่อ
ICLR 24 - ต.ค. 2023 [กระดาษ]
คำแนะนำ: การปรับแต่งโพสต์คำสั่ง
ไม่ระบุชื่อ
ICLR 24 - ต.ค. 2023 [กระดาษ]
แน่นอน: การปรับปรุงคำถามแบบเปิดโดเมนของ LLMs ผ่านการดึงข้อมูลสรุป
ไม่ระบุชื่อ
ICLR 24 - ต.ค. 2023 [กระดาษ]
recomp: การปรับปรุง LMS การดึงข้อมูลพร้อมกับการบีบอัดบริบทและการเพิ่มการเลือก
ไม่ระบุชื่อ
ICLR 24 - ต.ค. 2023 [กระดาษ]
การดึงข้อมูลเป็นรุ่นที่แม่นยำ
ไม่ระบุชื่อ
ICLR 24 - ต.ค. 2023 [กระดาษ]
PaperQa: ตัวแทนทั่วไปที่ได้รับรางวัลสำหรับการวิจัยทางวิทยาศาสตร์
ไม่ระบุชื่อ
ICLR 24 - ต.ค. 2023 [กระดาษ]
การทำความเข้าใจการเพิ่มการดึงข้อมูลสำหรับการตอบคำถามแบบยาว
ไม่ระบุชื่อ
ICLR 24 - ต.ค. 2023 [กระดาษ]
การสร้างภาษาส่วนบุคคลผ่านการดึงตัวชี้วัดแบบเบย์
ไม่ระบุชื่อ
ICLR 24 - ต.ค. 2023 [กระดาษ]
DSPY: การรวบรวมรูปแบบภาษาที่ประกาศใช้ในการปรับปรุงตัวเองไปป์ไลน์
Omar Khattab, Arnav Singhvi, Paridhi Maheshwari, Zhiyuan Zhang, Keshav Santhanam, Sri Vardhamanan, Saiful Haq, Ashutosh Sharma, Thomas T. Joshi, Hanna Moazam
arxiv - ต.ค. 2023 [กระดาษ] [รหัส]
RA-DIT: การปรับแต่งคำสั่งคู่แบบเรียกคืน
Xi Victoria Lin, Xilun Chen, Mingda Chen, Weijia Shi, Maria Lomeli, Rich James, Pedro Rodriguez, Jacob Kahn, Gergely Szilvasy, Mike Lewis, Luke Zettlemoyer, Scott Yih
arxiv - ส.ค. 2023 [กระดาษ]
เอกสารเครื่องมือช่วยให้เครื่องมือการใช้เครื่องมือแบบไม่มีการยิงด้วยรุ่นภาษาขนาดใหญ่
Cheng-yu Hsieh, Si-an Chen, Chun-Liang Li, Yasuhisa Fujii, Alexander Ratner, Chen-yu Lee, Ranjay Krishna, Tomas Pfister
arxiv - ส.ค. 2023 [กระดาษ]
reaugkd: การกลั่นความรู้ที่รอการดึงข้อมูลสำหรับแบบจำลองภาษาที่ผ่านการฝึกอบรมมาก่อน
Jianyi Zhang, Aashiq Muhamed, Aditya Anantharaman, Guoyin Wang, Changyou Chen, Kai Zhong, Qingjun Cui, Yi Xu, Belinda Zeng, Trishul Chilimbi, Yiran Chen
ACL 23 - ก.ค. 2023 [กระดาษ]
การดึงข้อมูลบนพื้นผิวช่วยลดความงุนงงของแบบจำลองภาษาแบบดึง
Ehsan Doostmohammadi, Tobias Norlund, Marco Kuhlmann, Richard Johansson
ACL 23 - ก.ค. 2023 [กระดาษ]
การปรับแต่งแบบนุ่มนวลสำหรับการเพิ่มการดึงข้อมูลหนาแน่นด้วยรุ่นภาษาขนาดใหญ่
Zhiyuan Peng, Xuyang Wu, Yi Fang
arxiv - มิ.ย. 2023 [กระดาษ]
reta-llm: ชุดเครื่องมือจำลองภาษาขนาดใหญ่ที่เรียกคืนได้
Jiongnan Liu, Jiajie Jin, Zihan Wang, Jiehan Cheng, Zhicheng Dou, Ji-Rong Wen
arxiv - มิ.ย. 2023 [กระดาษ]
WebGLM: ไปสู่ระบบตอบคำถามที่ปรับปรุงเว็บที่มีประสิทธิภาพด้วยการตั้งค่าของมนุษย์
Xiao Liu, Hanyu Lai, Hao Yu, Yifan Xu, Aohan Zeng, Zhengxiao Du, Peng Zhang, Yuxiao Dong, Jie Tang
arxiv - มิ.ย. 2023 [กระดาษ]
Wikichat: การหยุดภาพหลอนของ chatbots รูปแบบภาษาขนาดใหญ่โดยไม่กี่นัดบนวิกิพีเดีย
Sina J. Semnani, Violet Z. Yao, Heidi C. Zhang, Monica S. Lam
การค้นพบ EMNLP 2023 - พฤษภาคม 2023 [กระดาษ] [รหัส] [ตัวอย่าง]
ret-llm: ไปยังหน่วยความจำอ่าน-เขียนทั่วไปสำหรับรุ่นภาษาขนาดใหญ่
Ali Modarressi, Ayyoob Imani, Mohsen Fayyaz, Hinrich Schutze
arxiv - พฤษภาคม 2023 [กระดาษ]
กอริลลา: โมเดลภาษาขนาดใหญ่เชื่อมต่อกับ API ขนาดใหญ่
Shishir G. Patil, Tianjun Zhang, Xin Wang, Joseph E. Gonzalez
arxiv - พฤษภาคม 2023 [กระดาษ] [รหัส]
เราจะเตรียมโมเดลภาษาแบบอัตโนมัติด้วยการดึงข้อมูลหรือไม่? การศึกษาที่ครอบคลุม
Boxin Wang, Wei Ping, Peng Xu, Lawrence McAfee, Zihan Liu, Mohammad Shoeybi, Yi Dong, Oleksii Kuchaiev, Bo Li, Chaowei Xiao, Anima Anandkumar, Bryan Catanzaro
arxiv - เม.ย. 2023 [กระดาษ] [รหัส]
ตรวจสอบข้อเท็จจริงของคุณและลองอีกครั้ง: ปรับปรุงรูปแบบภาษาขนาดใหญ่ด้วยความรู้ภายนอกและข้อเสนอแนะอัตโนมัติ
Baolin Peng, Michel Galley, Pengcheng HE, Hao Cheng, Yujia Xie, Yu Hu, Qiuyuan Huang, Lars Liden, Zhou Yu, Weizhu Chen, Jianfeng Gao
arxiv - ก.พ. 2023 [กระดาษ] [รหัส]
Toolformer: แบบจำลองภาษาสามารถสอนตัวเองให้ใช้เครื่องมือ
Timo Schick, Jane Dwivedi-yu, Roberto Dessì, Roberta Raileanu, Maria Lomeli, Luke Zettlemoyer, Nicola Cancedda, Thomas Scialom
arxiv - ก.พ. 2023 [กระดาษ]
REPLUG: โมเดลภาษา Black-Box Retrieval-Augmented
Weijia Shi, Sewon Min, Michihiro Yasunaga, Minjoon Seo, Rich James, Mike Lewis, Luke Zettlemoyer, Wen-Tau Yih
arxiv - ม.ค. 2023 [กระดาษ]
รูปแบบภาษาที่มีการดึงข้อมูลในบริบท
Ori Ram, Yoav Levine, Itay Dalmedigos, Dor Muhlgay, Amnon Shashua, Kevin Leyton-Brown, Yoav Shoham
AI21 Labs - ม.ค. 2023 [กระดาษ] [รหัส]
สูตรสำหรับการสร้าง chatbot โดเมนเปิด
Stephen Roller, Emily Dinan, Naman Goyal, Da Ju, Mary Williamson, Yinhan Liu, Jing Xu, Myle Ott, Eric Michael Smith, Y-Lan Boureau, Jason Weston
EACL 2021 - เม.ย. 2021 [กระดาษ]
Atman: ทำความเข้าใจกับการทำนายของหม้อแปลงผ่านการจัดการความสนใจของหน่วยความจำที่มีประสิทธิภาพ
Hamed Zamani, Johanne R. Trippas, Jeff Dalton และ Filip Radlinski
arxiv - ม.ค. 2023 [กระดาษ]
Retromae V2: การเข้ารหัสอัตโนมัติแบบดูเพล็กซ์สำหรับโมเดลภาษาที่มุ่งเน้นการฝึกอบรมก่อนการฝึกอบรม
SHITAO XIAO, ZHENG LIU
arxiv - พ.ย. 2023 [กระดาษ]
แสดงให้เห็นถึงการค้นหาการทำนาย: การเขียนแบบจำลองการดึงและภาษาสำหรับ NLP Omar Khattab ที่ใช้ความรู้อย่างเข้มข้น, Keshav Santhanam, Xiang Lisa Li, David Hall, Percy Liang, Christopher Potts, Matei Zaharia
arxiv - ธ.ค. 2022 [กระดาษ]
การปรับปรุงแบบจำลองภาษาโดยการดึงโทเค็นจากล้านล้าน
Sebastian Borgeaud, Arthur Mensch, Jordan Hoffmann, Trevor Cai, Eliza Rutherford, Katie Millican, George Van Den Driessche, Jean-Baptiste Lespiau, Bogdan Damoc, Aidan Clark, Diego de Las Loren Maggiore, Chris Jones, Albin Cassirer, Andy Brock, Michela Paganini, Geoffrey Irving, Oriol Vinyals, Simon Osindero, Karen Simonyan, Jack W. Rae, Erich Elsen และ Laurent Sifre
arxiv - ก.พ. 2022 [กระดาษ]
การปรับปรุงแบบจำลองภาษาโดยการดึงโทเค็นจากล้านล้าน
Sebastian Borgeaud, Arthur Mensch, Jordan Hoffmann, Trevor Cai, Eliza Rutherford, Katie Millican, George Van Den Driessche, Jean-Baptiste Lespiau, Bogdan Damoc, Aidan Clark, Diego de Las Loren Maggiore, Chris Jones, Albin Cassirer, Andy Brock, Michela Paganini, Geoffrey Irving, Oriol Vinyals, Simon Osindero, Karen Simonyan, Jack W. Rae, Erich Elsen, Laurent Sifre
arxiv - ธ.ค. 2021 [กระดาษ]
WebGPT: การตอบคำถามที่ได้รับการช่วยเหลือจากเบราว์เซอร์พร้อมคำติชมของมนุษย์
Reiichiro Nakano, Jacob Hilton, Suchir Balaji, Jeff Wu, Long Ouyang, Christina Kim, Christopher Hesse, Shantanu Jain, Vineet Kosaraju, William Saunders, Xu Jiang, Karl Cobbe, Tyna
arxiv - ธ.ค. 2021 [กระดาษ]
bert-knn: การเพิ่มองค์ประกอบการค้นหา KNN ในแบบจำลองภาษาที่ผ่านการฝึกอบรมเพื่อให้ดีขึ้น QA
Nora Kassner, Hinrich Schütze
EMNLP 2020 - พ.ย. 2020 [กระดาษ]
Realm: รูปแบบภาษาที่เรียกคืนก่อนการฝึกอบรมก่อน
Kelvin Guu, Kenton Lee, Zora Tung, Panupong Pasupat, Ming-Wei Chang
ICML 2020 - ก.ค. 2020 [กระดาษ]
รูปแบบการสนทนาทางระบบประสาทแบบไฮบริด
Liu Yang, Junjie Hu, Minghui Qiu, Chen Qu, Jianfeng Gao, W. Bruce Croft, Xiaodong Liu, Yelong Shen, Jingjing Liu
arxiv - เม.ย. 2019 [กระดาษ]
มีสายดินในน้ำหนักแบบจำลองภายในเวลาอนุมาน
แบบจำลองภาษาขนาดใหญ่ได้รับความรู้จริงในระหว่างการผ่าตัดอย่างไร
Hoyeon Chang, Jinho Park, Seonghyeon Ye, Sohee Yang, Youngkyung Seo, Du-seong Chang, Minjoon Seo
arxiv - มิ.ย. 2024 [กระดาษ]
แบบจำลองภาษาที่ปรับแต่งได้สำหรับความเป็นจริง
Katherine Tian, Eric Mitchell, Huaxiu Yao, Christopher D. Manning, Chelsea Finn
arxiv - พ.ย. 2023 [กระดาษ]
R-tuning: การสอนแบบจำลองภาษาขนาดใหญ่เพื่อปฏิเสธคำถามที่ไม่รู้จัก
Hanning Zhang, Shizhe Diao, Yong Lin, Yi R. Fung, Qing Lian, Xingyao Wang, Yangyi Chen, Heng Ji, Tong Zhang
arxiv - พ.ย. 2023 [กระดาษ]
EasyEdit: กรอบการแก้ไขความรู้ที่ใช้งานง่ายสำหรับแบบจำลองภาษาขนาดใหญ่
Peng Wang, Ningyu Zhang, Xin Xie, Yunzhi Yao, Bozhong Tian, Mengru Wang, Zekun Xi, Siyuan Cheng, Kangwei Liu, Guozhou Zheng, Huajun Chen
arxiv - ส.ค. 2023 [กระดาษ]
การตรวจสอบและแก้ไขการเป็นตัวแทนความรู้ในรูปแบบภาษา
Evan Hernandez, Belinda Z. Li, Jacob Andreas
arxiv - เม.ย. 2023 [กระดาษ] [รหัส]
ใช้ประโยชน์จากการดึงข้อความด้วยแบบจำลองการกำเนิดสำหรับการตอบคำถามโดเมนแบบเปิด
Gautier Izacard, Edouard Grave
arxiv - ก.พ. 2023 [กระดาษ]
ค้นพบความรู้แฝงในรูปแบบภาษาโดยไม่มีการกำกับดูแล
Collin Burns, Haotian Ye, Dan Klein, Jacob Steinhardt
ICLR 23 - ก.พ. 2023 [กระดาษ] [รหัส]
Galactica: แบบจำลองภาษาขนาดใหญ่สำหรับวิทยาศาสตร์
Ross Taylor, Marcin Kardas, Guillem Cucurull, Thomas Scialom, Anthony Hartshorn, Elvis Saravia, Andrew Poulton, Viktor Kerkez, Robert Stojnic
galactica.org - 2022 [กระดาษ]
BlenderBot 3: ตัวแทนการสนทนาที่ปรับใช้ซึ่งเรียนรู้อย่างต่อเนื่อง
Kurt Shuster, Jing Xu, Mojtaba Komeili, Da Ju, Eric Michael Smith, Stephen Roller, Megan Ung, Moya Chen, Kushal Arora, Joshua Lane, Morteza Behrooz, William Ngan, Spencer Poff, Naman Goyal
arxiv - ส.ค. 2022 [กระดาษ]
สร้างแทนที่จะดึง: โมเดลภาษาขนาดใหญ่เป็นเครื่องกำเนิดบริบทที่แข็งแกร่ง
Wenhao Yu, Dan Iter, Shuohang Wang, Yichong Xu, Mingxuan Ju, Soumya Sanyal, Chenguang Zhu, Michael Zeng, Meng Jiang
ICLR 2023 - ก.ย. 2022 [กระดาษ]
แบบจำลองภาษาที่มีการตกแต่ง
Zhiqing Sun, Xuezhi Wang, Yi Tay, Yiming Yang, Denny Zhou
ICLR 2023 - ก.ย. 2022 [กระดาษ]
การปรับปรุงการจัดตำแหน่งตัวแทนการสนทนาผ่านการตัดสินของมนุษย์เป้าหมาย
Amelia Glaese, Nat McAleese, Maja Trębacz, John Aslanides, Vlad Firoiu, Timo Ewalds, Maribeth Rauh, Laura Weidinger, Martin Chadwick, Phoebe Thacker, Lucy Campbell-Gillingham Dathathri, Rory Greig, Charlie Chen, Doug Fritz, Jaume Sanchez Elias, Richard Green, SoňaMokrá, Nicholas Fernando, Boxi Wu, Rachel Foley, Susannah Young, Iason Gabriel, William Isaac Hendricks, Geoffrey Irving
arxiv - ก.ย. 2022 [กระดาษ]
Lamda: โมเดลภาษาสำหรับแอปพลิเคชันโต้ตอบ
Romal Thoppilan, Daniel de Freitas, Jamie Hall, Noam Shazeer, Apoorv Kulshreshtha, Heng-Tze Cheng, Alicia Jin, Taylor Bos, Leslie Baker, Yu Du, Yaguang Li, Hongrae Lee, Huaixiu Steven Zheng Krikun, Dmitry Lepikhin, James Qin, Dehao Chen, Yuanzhong Xu, Zhifeng Chen, Adam Roberts, Maarten Bosma, Vincent Zhao, Yanqi Zhou, Chung-Ching Chang, Igor Krivokon, Will Rusch Meredith Ringel Morris, Tulsee Doshi, Renelito Delos Santos, Toju Duke, Johnny Soraker, Ben Zevenbergen, Vinodkumar Prabhakaran, Mark Diaz, Ben Hutchinson, Kristen Olson, Alejandra Molina, Erin Hoffman-John Matthew Lamm, Viktoriya Kuzmina, Joe Fenton, Aaron Cohen, Rachel Bernstein, Ray Kurzeil, Blaise Aguera-Arcas, Claire Cui, Marian Croak, Ed Chi, Quoc Le
arxiv - ม.ค. 2022 [กระดาษ]
แบบจำลองภาษาเป็นหรือฐานความรู้
Simon Razniewski, Andrew Yates, Nora Kassner, Gerhard Weikum
DL4KG 2021 - ต.ค. 2021 [กระดาษ]
การวางนัยทั่วไปผ่านการท่องจำ: โมเดลภาษาเพื่อนบ้านที่ใกล้ที่สุด
Urvashi Khandelwal, Omer Levy, Dan Jurafsky, Luke Zettlemoyer, Mike Lewis
ICLR 2020 - ก.ย. 2019 [กระดาษ] [รหัส]
CHATGPT ค้นหาได้ดีหรือไม่? การตรวจสอบรูปแบบภาษาขนาดใหญ่เป็นตัวแทนจัดอันดับใหม่
Wenhao Yu, Hongming Zhang, Xiaoman Pan, Kaixin MA, Hongwei Wang, Dong Yu
arxiv - พ.ย. 2023 [กระดาษ]
คำสั่งการกลั่นทำให้แบบจำลองภาษาขนาดใหญ่มีประสิทธิภาพเป็นศูนย์ช็อตอันดับ
Weiwei Sun, Zheng Chen, Xinyu MA, Lingyong Yan, Shuaiqiang Wang, Pengjie Ren, Zhumin Chen, Dawei Yin, Zhaochun Ren
Arxiv 2023 - พ.ย. 2023 [กระดาษ]
นักวิจารณ์: แบบจำลองภาษาขนาดใหญ่สามารถแก้ไขตนเองได้ด้วยการวิพากษ์วิจารณ์เครื่องมือ
Zhibin Gou, Zhihong Shao, Yeyun Gong, Yelong Shen, Yujiu Yang, Nan Duan, Weizhu Chen
ICLR 2024 - ม.ค. 2024 [กระดาษ]
ตะเข็บในเวลาบันทึกเก้า: การตรวจจับและบรรเทาภาพหลอนของ LLMS โดยการตรวจสอบการสร้างความมั่นใจต่ำ
Neeraj Varshney, Wenlin Yao, Hongming Zhang, Jianshu Chen, Dong Yu
arxiv - ส.ค. 2023 [กระดาษ]
RARR: การค้นคว้าและแก้ไขโมเดลภาษาพูดโดยใช้แบบจำลองภาษา
Luyu Gao, Zhuyun Dai, Panupong Pasupat, Anthony Chen, Arun Tejasvi Chaganty, Yicheng Fan, Vincent Zhao, Ni Lao, Hongrae Lee, Da-Cheng Juan, Kelvin Guu Guu
ACL 2023 - ก.ค. 2023 [กระดาษ]
การตรวจสอบและแก้ไข: กรอบความรู้ที่เพิ่มขึ้นของความรู้
Ruochen Zhao, Xingxuan Li, Shafiq Joty, Chengwei Qin, Lidong Bing
ACL 2023 - ก.ค. 2023 [กระดาษ]
รุ่นเพิ่มการดึงข้อมูลที่ใช้งานอยู่
Zhengbao Jiang, Frank F. Xu, Luyu Gao, Zhiqing Sun, Qian Liu, Jane Dwivedi-Yu, Yiming Yang, Jamie Callan, Graham Neubig
arxiv - พฤษภาคม 2023 [กระดาษ] [รหัส]
การปรับปรุงรูปแบบภาษาผ่านข้อเสนอแนะการดึงปลั๊กและเล่น
Wenhao Yu, Zhihan Zhang, Zhenwen Liang, Meng Jiang, Ashish Sabharwal
arxiv - พฤษภาคม 2023 [กระดาษ]
การสอบเทียบภาษาศาสตร์ของรุ่นยาว
Neil Band, Xuechen Li, Tengyu MA, Tatsunori Hashimoto
Arxiv 2024 - มิ.ย. 2024 [กระดาษ]
เชื่อหรือไม่เชื่อ LLM ของคุณ
Yasin Abbasi Yadkori, Ilja Kuzborskij, AndrásGyörgy, Csaba Szepesvári
Arxiv 2024 - มิ.ย. 2024 [กระดาษ]
SAYELF: การสอน LLMS เพื่อแสดงความมั่นใจกับเหตุผลที่สะท้อนตนเอง
Tianyang Xu, Shujin Wu, Shizhe Diao, Xiaoze Liu, Xingyao Wang, Yangyi Chen, Jing Gao
Arxiv 2024 - พฤษภาคม 2024 [กระดาษ]
ผู้เชี่ยวชาญไม่โกง: เรียนรู้สิ่งที่คุณไม่รู้จักโดยการทำนายคู่
Daniel D. Johnson, Daniel Tarlow, David Duvenaud, Chris J. Maddison
Arxiv 2024 - ก.พ. 2024 [กระดาษ]
ปลดล็อคการสร้างข้อความที่คาดการณ์ไว้: วิธีการที่ จำกัด สำหรับการถอดรหัสที่ซื่อสัตย์ด้วยแบบจำลองภาษาขนาดใหญ่
ไม่ระบุชื่อ
ICLR 24 - ต.ค. 2023 [กระดาษ]
Dola: การถอดรหัสโดยเลเยอร์ที่ตัดกันช่วยเพิ่มความเป็นจริงในรูปแบบภาษาขนาดใหญ่
ยูง-ซองชูฮัง, ยูเจีย xie, ฮงยี่นลูโอ, ยุนคิม, เจมส์แก้ว, เพงเฉิงเขา
ICLR 24 - ก.ย. 2023 [กระดาษ]
วิธีการที่เน้นข้อมูลเป็นศูนย์กลางในการสร้างบทสรุปผู้ป่วยที่ซื่อสัตย์และมีคุณภาพสูงด้วยแบบจำลองภาษาขนาดใหญ่
Stefan Hegselmann, Shannon Zejiang Shen, Florian Gierse, Monica Agrawal, David Sontag, Xiaoyi Jiang
arxiv 24 - ก.พ. 2024 [กระดาษ]
STOCHAST RAG: การสร้างการดึงข้อมูลแบบ end-to-end ผ่านการเพิ่มยูทิลิตี้ที่คาดหวังสูงสุด
Hamed Zamani, Michael Bendersky
arxiv 24 - พฤษภาคม 2024 [กระดาษ]
รัฐธรรมนูญ AI: ความไม่เป็นอันตรายจากข้อเสนอแนะ AI
Yuntao Bai, Saurav Kadavath, Sandipan Kundu, Amanda Askell, Jackson Kernion, Andy Jones, Anna Chen, Anna Goldie, Azalia Mirhoseini, Cameron McKinnon, Carol Chen, Catherine Olsson, Christopher Olah Perez, Jamie Kerr, Jared Mueller, Jeffrey Ladish, Joshua Landau, Kamal Ndousse, Kamile Lukosiute, Liane Lovitt, Michael Sellitto, Nelson Elhage, Nicholas Schiefer, Noemi Mercado Showk, ป้อม Stanislav, Tamera Lanham, Timothy Telleen-Lawton, Tom Conerly, Tom Henighan, Tristan Hume, Samuel R. Bowman, Zac Hatfield-Dodds, Ben Mann, Dario Amodei, Nicholas Joseph, Sam McCandlish
การเรียนรู้ทักษะใหม่หลังจากการปรับใช้: การปรับปรุงการสนทนาที่ขับเคลื่อนด้วยอินเทอร์เน็ตแบบเปิดโดเมนด้วยความคิดเห็นของมนุษย์
Jing Xu, Megan Ung, Mojtaba Komeili, Kushal Arora, Y-Lan Boureau, Jason Weston
arxiv - ส.ค. 2022 [กระดาษ]
การสร้างแบบจำลองภาษาหลายรูปแบบที่เรียกคืน
Michihiro Yasunaga, Armen Aghajanyan, Weijia Shi, Rich James, Jure Leskovec, Percy Liang, Mike Lewis, Luke Zettlemoyer, Wen-Tau Yih
arxiv - พ.ย. 2022 [กระดาษ]
RAMM: คำถามเกี่ยวกับภาพชีวการแพทย์ที่ได้รับการตอบกลับด้วยการตอบคำถามก่อนการฝึกอบรมหลายโมดอล
Zheng Yuan, Qiao Jin, Chuanqi Tan, Zhengyun Zhao, Hongyi Yuan, Fei Huang, Songfang Huang
arxiv - มี.ค. 2023 [กระดาษ]
การดึงข้อมูลระหว่างกันด้วยการใช้เหตุผลในการใช้ความรู้สำหรับคำถามหลายขั้นตอนที่มีความรู้หลายขั้นตอน Trivedi, Niranjan Balasubramanian, Tushar Khot และ Ashish Sabharwal ACL 23-Jul 2023 [กระดาษ]
ตอบสนอง: การรวมเหตุผลและการแสดงในรูปแบบภาษา
Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan, หยวน Cao
arxiv - ต.ค. 2022 [กระดาษ]
repocoder: รหัสที่เก็บเสร็จสมบูรณ์ผ่านการดึงซ้ำและการสร้างซ้ำ
Fengji Zhang, Bei Chen, Yue Zhang, Jin Liu, Daoguang Zan, Yi Mao, Jian-Guang Lou, Weizhu Chen
arxiv - มี.ค. 2023 [กระดาษ]
DocPrompting: การสร้างรหัสโดยการดึงเอกสาร
Shuyan Zhou, Uri Alon, Frank F. Xu, Zhiruo Wang, Zhengbao Jiang, Graham Neubig
ICLR 23 - ก.ค. 2022 [กระดาษ] [รหัส] [ข้อมูล]
สร้างตัวกรองและฟิวส์: การขยายการสอบถามผ่านการสร้างคำหลักแบบหลายขั้นตอนสำหรับการจัดอันดับ Neural Zero-shot
Minghan Li, Honglei Zhuang, Kai Hui, Zhen Qin, Jimmy Lin, Rolf Jagerman, Xuanhui Wang, Michael Bendersky
arxiv - พ.ย. 2023 [กระดาษ]
Agent4Ranking: การจัดอันดับที่แข็งแกร่งทางความหมายผ่านการเขียนแบบสอบถามส่วนบุคคลใหม่โดยใช้ LLM หลายตัวแทน
Xiaopeng Li, Lixin Su, Pengyue Jia, Xiangyu Zhao, Suqi Cheng, Junfeng Wang, Dawei Yin
arxiv - ธ.ค. 2023 [กระดาษ]
Unified Generative & Dense Retrieval สำหรับการสืบค้นใหม่ในการค้นหาที่ได้รับการสนับสนุน
Akash Kumar Mohankumar, Bhargav Dodla, Gururaj K, Amit Singh
arxiv - ก.ย. 2022 [กระดาษ]
การสร้างการเล่าเรื่องการเล่าเรื่องที่สอดคล้องกันตามข้อเท็จจริง
Noah Sarfati, Ido Yerushalmy, Michael Chertok, Yosi Keller
MMSPORTS 2023 - 23 ต.ค. [กระดาษ]
การดึงข้อมูลการกำเนิดทางพันธุกรรม
Hrishikesh Kulkarni, Zachary Young, Nazli Goharian, Ophir Frieder, Sean Macavaney
Doceng 23 - 23 ส.ค. [กระดาษ]
เรียนรู้ที่จะสรุปด้วยความคิดเห็นของมนุษย์
Nisan Stiennon, Long Ouyang, Jeff Wu, Daniel M. Ziegler, Ryan Lowe, Chelsea Voss, Alec Radford, Dario Amodei, Paul Christiano
Neurips 2020 - Sep 2020 [กระดาษ]
เกี่ยวกับความซื่อสัตย์และข้อเท็จจริงในการสรุปนามธรรม
Joshua Maynez, Shashi Narayan, Bernd Bohnet, Ryan McDonald
ACL 2020 – May 2020 [paper]
Augment before You Try: Knowledge-Enhanced Table Question Answering via Table Expansion
Yujian Liu, Jiabao Ji, Tong Yu, Ryan Rossi, Sungchul Kim, Handong Zhao, Ritwik Sinha, Yang Zhang, Shiyu Chang
arXiv – Jan 2024 [paper]
We jump-started this section by reusing the content of awesome-generative-retrieval-models and give full credit to Chriskuei for that! We now have added some content on top.
De-DSI: Decentralised Differentiable Search Index
Petru Neague, Marcel Gregoriadis, Johan Pouwelse
EuroMLSys 24 – Apr 2024 [paper]
Listwise Generative Retrieval Models via a Sequential Learning Process
Yubao Tang, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Wei Chen, Xueqi Cheng
TOIS 2024 – Mar 2024 [Paper]
Distillation Enhanced Generative Retrieval
Yongqi Li, Zhen Zhang, Wenjie Wang, Liqiang Nie, Wenjie Li, Tat-Seng Chua
arXiv 2024 – Feb 2024 [Paper]
Self-Retrieval: Building an Information Retrieval System with One Large Language Model
Qiaoyu Tang, Jiawei Chen, Bowen Yu, Yaojie Lu, Cheng Fu, Haiyang Yu, Hongyu Lin, Fei Huang, Ben He, Xianpei Han, Le Sun, Yongbin Li
arXiv 2024 – Feb 2024 [Paper]
Generative Dense Retrieval: Memory Can Be a Burden
Peiwen Yuan, Xinglin Wang, Shaoxiong Feng, Boyuan Pan, Yiwei Li, Heda Wang, Xupeng Miao, Kan Li
EACL 2024 - Jan 2024 [paper] [code]
Auto Search Indexer for End-to-End Document Retrieval
Tianchi Yang, Minghui Song, Zihan Zhang, Haizhen Huang, Weiwei Deng, Feng Sun, Qi Zhang
EMNLP 2023 - December 23 [paper]
DiffusionRet: Diffusion-Enhanced Generative Retriever using Constrained Decoding
Shanbao Qiao, Xuebing Liu, Seung-Hoon Na
EMNLP Findings 2023 – Dec 2023 [paper]
Scalable and Effective Generative Information Retrieval
Hansi Zeng, Chen Luo, Bowen Jin, Sheikh Muhammad Sarwar, Tianxin Wei, Hamed Zamani
WWW 2024 - Nov 2023 [paper] [code]
Nonparametric Decoding for Generative Retrieval
Hyunji Lee, JaeYoung Kim, Hoyeon Chang, Hanseok Oh, Sohee Yang, Vladimir Karpukhin, Yi Lu, Minjoon Seo
ACL Findings 2023 – Jul 2023 [paper]
Model-enhanced Vector Index
Hailin Zhang, Yujing Wang, Qi Chen, Ruiheng Chang, Ting Zhang, Ziming Miao, Yingyan Hou, Yang Ding, Xupeng Miao, Haonan Wang, Bochen Pang, Yuefeng Zhan, Hao Sun, Weiwei Deng, Qi Zhang, Fan Yang, Xing Xie, Mao Yang, Bin Cui
NeurIPS 2023 – May 2023 [paper] [code]
Continual Learning for Generative Retrieval over Dynamic Corpora
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Wei Chen, Yixing Fan, Xueqi Cheng
CIKM 2023 - Aug 2023 [paper]
Learning to Rank in Generative Retrieval
Yongqi Li, Nan Yang, Liang Wang, Furu Wei, Wenjie Li
arXiv – Jun 2023 [paper]
Large Language Models are Built-in Autoregressive Search Engines
Noah Ziems, Wenhao Yu, Zhihan Zhang, Meng Jiang
ACL Findings 2023 – May 2023 [paper]
Multiview Identifiers Enhanced Generative Retrieval
Yongqi Li, Nan Yang, Liang Wang, Furu Wei, Wenjie Li
ACL 2023 – May 2023 [paper]
How Does Generative Retrieval Scale to Millions of Passages?
Ronak Pradeep, Kai Hui, Jai Gupta, Adam D. Lelkes, Honglei Zhuang, Jimmy Lin, Donald Metzler, Vinh Q. Tran
arXiv – May 2023 [paper]
TOME: A Two-stage Approach for Model-based Retrieval
Ruiyang Ren, Wayne Xin Zhao, Jing Liu, Hua Wu, Ji-Rong Wen, Haifeng Wang
ACL 2023 - May 2023 [paper]
Understanding Differential Search Index for Text Retrieval
Xiaoyang Chen, Yanjiang Liu, Ben He, Le Sun, Yingfei Sun
ACL Findings 2023 - May 2023 [paper]
Learning to Tokenize for Generative Retrieval
Weiwei Sun, Lingyong Yan, Zheng Chen, Shuaiqiang Wang, Haichao Zhu, Pengjie Ren, Zhumin Chen, Dawei Yin, Maarten de Rijke, Zhaochun Ren
arXiv – Apr 2023 [paper]
DynamicRetriever: A Pre-trained Model-based IR System Without an Explicit Index
Yu-Jia Zhou, Jing Yao, Zhi-Cheng Dou, Ledell Wu, Ji-Rong Wen
Machine Intelligence Research – Jan 2023 [paper]
DSI++: Updating Transformer Memory with New Documents
Sanket Vaibhav Mehta, Jai Gupta, Yi Tay, Mostafa Dehghani, Vinh Q. Tran, Jinfeng Rao, Marc Najork, Emma Strubell, Donald Metzler
arXiv – Dec 2022 [paper]
CodeDSI: Differentiable Code Search
Usama Nadeem, Noah Ziems, Shaoen Wu
arXiv – Oct 2022 [paper]
Contextualized Generative Retrieval
Hyunji Lee, Jaeyoung Kim, Hoyeon Chang, Hanseok Oh, Sohee Yang, Vlad Karpukhin, Yi Lu, Minjoon Seo
arXiv – Oct 2022 [paper]
Transformer Memory as a Differentiable Search Index
Yi Tay, Vinh Q. Tran, Mostafa Dehghani, Jianmo Ni, Dara Bahri, Harsh Mehta, Zhen Qin, Kai Hui, Zhe Zhao, Jai Gupta, Tal Schuster, William W. Cohen, Donald Metzler
Neurips 2022 – Oct 2022 [paper] [Video] [third-party code]
A Neural Corpus Indexer for Document Retrieval
Wang et al.
Arxiv 2022 [paper]
Bridging the Gap Between Indexing and Retrieval for Differentiable Search Index with Query Generation
Shengyao Zhuang, Houxing Ren, Linjun Shou, Jian Pei, Ming Gong, Guido Zuccon, and Daxin Jiang
Arxiv 2022 [paper] [Code]
DynamicRetriever: A Pre-training Model-based IR System with Neither Sparse nor Dense Index
Zhou et al
Arxiv 2022 [paper]
Ultron: An Ultimate Retriever on Corpus with a Model-based Indexer
Zhou et al
Arxiv 2022 [paper]
Planning Ahead in Generative Retrieval: Guiding Autoregressive Generation through Simultaneous Decoding
Hansi Zeng ,Chen Luo ,Hamed Zamani
arXiv – Apr 2024 [paper] [Code]
NOVO: Learnable and Interpretable Document Identifiers for Model-Based IR
Zihan Wang, Yujia Zhou, Yiteng Tu, Zhicheng Dou
CIKM 2023 - October 2023 [paper]
Generative Retrieval as Multi-Vector Dense Retrieval
Shiguang Wu, Wenda Wei, Mengqi Zhang, Zhumin Chen, Jun Ma, Zhaochun Ren, Maarten de Rijke, Pengjie Ren
SIGIR 2024 - March 24 [paper] [Code]
Re3val: Reinforced and Reranked Generative Retrieval
EuiYul Song, Sangryul Kim, Haeju Lee, Joonkee Kim, James Thorne
EACL Findings 2023 – Jan 24 [paper]
GLEN: Generative Retrieval via Lexical Index Learning
Sunkyung Lee, Minjin Choi, Jongwuk Lee
EMNLP 2023 - December 23 [paper] [Code]
Enhancing Generative Retrieval with Reinforcement Learning from Relevance Feedback
Yujia Zhou, Zhicheng Dou, Ji-Rong Wen
EMNLP 2023 - December 23 [paper]
Generative Retrieval with Large Language Models
ไม่ระบุชื่อ
ICLR 24 – October 23 [paper]
Semantic-Enhanced Differentiable Search Index Inspired by Learning Strategies
Yubao Tang, Ruqing Zhang, Jiafeng Guo, Jiangui Chen, Zuowei Zhu, Shuaiqiang Wang, Dawei Yin, Xueqi Cheng
KDD 2023 – May 2023 [paper]
Term-Sets Can Be Strong Document Identifiers For Auto-Regressive Search Engines
Peitian Zhang, Zheng Liu, Yujia Zhou, Zhicheng Dou, Zhao Cao
arXiv – May 2023 [paper] [Code]
A Unified Generative Retriever for Knowledge-Intensive Language Tasks via Prompt Learning
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Yiqun Liu, Yixing Fan, Xueqi Cheng
SIGIR 2023 – Apr 2023 [paper] [Code]
CorpusBrain: Pre-train a Generative Retrieval Model for Knowledge-Intensive Language Tasks
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Yiqun Liu, Yixing Fan, Xueqi Cheng
CIKM 2022 – Aug 2022 [paper] [Code]
Autoregressive Search Engines: Generating Substrings as Document Identifiers
Michele Bevilacqua, Giuseppe Ottaviano, Patrick Lewis, Wen-tau Yih, Sebastian Riedel, Fabio Petroni
arXiv – Apr 2022 [paper] [Code]
Autoregressive Entity Retrieval
Nicola De Cao, Gautier Izacard, Sebastian Riedel, Fabio Petroni
ICLR 2021 – Oct 2020 [paper] [Code]
Data-Efficient Autoregressive Document Retrieval for Fact Verification
James Thorne
SustaiNLP@EMNLP 2022 – Nov 2022 [paper]
GERE: Generative Evidence Retrieval for Fact Verification
Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Yixing Fan, Xueqi Cheng
SIGIR 2022 [paper] [Code]
Generative Multi-hop Retrieval
Hyunji Lee, Sohee Yang, Hanseok Oh, Minjoon Seo
arXiv – Apr 2022 [paper]
Improving LLMs for Recommendation with Out-Of-Vocabulary Tokens
Ting-Ji Huang, Jia-Qi Yang, Chunxu Shen, Kai-Qi Liu, De-Chuan Zhan, Han-Jia Ye
arXiv – Jun 2024 [paper]
Plug-in Diffusion Model for Sequential Recommendation
Haokai Ma, Ruobing Xie, Lei Meng, Xin Chen, Xu Zhang, Leyu Lin, Zhanhui Kang
arXiv – Jan 2024 [paper]
Towards Graph-Aware Diffusion Modeling For Collaborative Filtering Yunqin Zhu1, Chao Wang, Hui Xiong
arXiv – Nov 2023 [paper]
RecMind: Large Language Model Powered Agent For Recommendation
Yancheng Wang, Ziyan Jiang, Zheng Chen, Fan Yang, Yingxue Zhou, Eunah Cho, Xing Fan, Xiaojiang Huang, Yanbin Lu, Yingzhen Yang
arXiv – Aug 2023 [paper]
Is ChatGPT Fair for Recommendation? Evaluating Fairness in Large Language Model Recommendation
Jizhi Zhang, Keqin Bao, Yang Zhang, Wenjie Wang, Fuli Feng, Xiangnan He
Recsys 2023 – Jul 2023 [paper]
RecFusion: A Binomial Diffusion Process for 1D Data for Recommendation
Gabriel Bénédict, Olivier Jeunen, Samuele Papa, Samarth Bhargav, Daan Odijk, Maarten de Rijke
arXiv – Jun 2023 [paper]
A First Look at LLM-Powered Generative News Recommendation
Qijiong Liu, Nuo Chen, Tetsuya Sakai, Xiao-Ming Wu
arXiv – Jun 2023 [paper]
Large Language Models as Zero-Shot Conversational Recommenders
Yupeng Hou, Junjie Zhang, Zihan Lin, Hongyu Lu, Ruobing Xie, Julian McAuley, Wayne Xin Zhao
arXiv – May 2023 [paper]
DiffuRec: A Diffusion Model for Sequential Recommendation
Zihao Li, Aixin Sun, Chenliang Li
arXiv – Apr 2023 [paper]
Diffusion Recommender Model
Wenjie Wang, Yiyan Xu, Fuli Feng, Xinyu Lin, Xiangnan He, Tat-Seng Chua
SIGIR 2023 – Apr 2023 [paper]
Blurring-Sharpening Process Models for Collaborative Filtering
Jeongwhan Choi, Seoyoung Hong, Noseong Park, Sung-Bae Cho
SIGIR 2023 – Apr 2023 [paper] [code]
Recommender Systems with Generative Retrieval
Shashank Rajput, Nikhil Mehta, Anima Singh, Raghunandan Keshavan, Trung Vu, Lukasz Heldt, Lichan Hong, Yi Tay, Vinh Q. Tran, Jonah Samost, Maciej Kula, Ed H. Chi, Maheswaran Sathiamoorthy
non-archival – Mar 2023 [paper]
Pre-train, Prompt and Recommendation: A Comprehensive Survey of Language Modelling Paradigm Adaptations in Recommender Systems
Peng Liu, Lemei Zhang, Jon Atle Gulla
arXiv – Feb 2023 [paper]
Generative Slate Recommendation with Reinforcement Learning
Romain Deffayet, Thibaut Thonet, Jean-Michel Renders, and Maarten de Rijke
WSDM 2023 – Feb 2023 [paper]
Recommendation via Collaborative Diffusion Generative Model
Joojo Walker, Ting Zhong, Fengli Zhang, Qiang Gao, Fan Zhou
KSEM 2022 – Aug 2022 [paper]
DocGraphLM: Documental Graph Language Model for Information Extraction
Dongsheng Wang, Zhiqiang Ma, Armineh Nourbakhsh, Kang Gu, Sameena Shah
arXiv – Jan 2024 [paper]
KBFormer: A Diffusion Model for Structured Entity Completion
Ouail Kitouni, Niklas Nolte, James Hensman, Bhaskar Mitra
arXiv – Dec 2023 [paper]
From Retrieval to Generation: Efficient and Effective Entity Set Expansion
Shulin Huang, Shirong Ma, Yangning Li, Yinghui Li, Hai-Tao Zheng, Yong Jiang
arXiv – Apr 2023 [paper]
Crawling the Internal Knowledge-Base of Language Models
Roi Cohen, Mor Geva, Jonathan Berant, Amir Globerson
arXiv – Jan 2023 [paper]
Prompt Tuning or Fine-Tuning - Investigating Relational Knowledge in Pre-Trained Language Models
Leandra Fichtel, Jan-Christoph Kalo, Wolf-Tilo Balke
AKBC 2021 – [paper]
Language Models as Knowledge Bases?
Fabio Petroni, Tim Rocktäschel, Patrick Lewis, Anton Bakhtin, Yuxiang Wu, Alexander H. Miller, Sebastian Riedel
EMNLP 2019 – Sep 2019 [paper]
Although some of these are not accompanied by a paper, they might be useful to other Generative IR researchers for empirical studies or interface design considerations.
⚡ Gemini Dec 2023 [live] ⚡️ factiverse Jun 2023 [live] ⚡️ devmarizer Mar 2023 [live] ⚡️ TaxGenius Mar 2023 [live] ⚡️ doc-gpt Mar 2023 [live] ⚡️ book-gpt Feb 2023 [live] ⚡️ Neeva Feb 2023 [live] ⚡️ Golden Retriever Feb 2023 [live] ⚡️ Bing – Prometheus Feb 2023 [waitlist] ⚡️ Google – Bard Feb 2023 [only in certain countries] ⚡️ Paper QA Feb 2023 [code] [demo] ⚡️ DocsGPT Feb 2023 [live] [code] ⚡️ DocAsker Jan 2023 [live] ⚡️ Lexii.ai Jan 2023 [live] ⚡️ YOU.com Dec 2022 [live] ⚡️ arXivGPT Dec 2022 [Chrome extension] ⚡️ GPT Index Nov 2022 [API] ⚡️ BlenderBot Aug 2022 [live (USA)] [model weights] [code] [paper1] [paper2] ⚡️ PHIND date? [live] ⚡️ Perplexity date? [live] ⚡️ Galactica date? [demo] [API] [paper] ⚡️ Elicit date? [live] ⚡️ ZetaAlpha date? [live] uses OpenAI API
To get just the paper titles do grep '**' README.md | sed 's/**//g'