令人敬畏的LLM自願:大語言模型中的自我一致性列表
該存儲庫稱為LLMS的自偏見,其中包含有關大語言模型中自相連的資源和論文的集合。
“我看不到可以保證安全的道路。我們正在進入一個充滿不確定性的時期,我們正在處理以前從未處理過的事情,而且我們無法承受這些事情的誤解,因為它們可能會接管這些事情。
歡迎通過提交問題分享您的論文,想法和想法!
教語言模型推理
Denny Zhou,Google Deepmind
[關聯]
2023年9月
人工通用情報的途徑:對抗LLM對話的見解
愛德華Y.張
Socrasynth.com,[鏈接]
2024年3月
自然語言處理的基礎模型:預先訓練的語言模型集成媒體
GerhardPaaß,Sven Giesselbach
人工智能:基礎,理論和算法(Springer自然),[鏈接]
2023年2月16日
GSM8K一致性:
GSM8K基准上算術推理的一致性
Shuyue Jia
擁抱臉2023,[擁抱臉] [github]
2023年12月1日
GSM8K :
培訓驗證者以解決數學單詞問題
Karl Cobbe,Vineet Kosaraju,Mohammad Bavarian,Mark Chen,Heewoo Jun,Lukasz Kaiser,Matthias Plappert,Jerry Tworek,Jerry Tworek,Jacob Hilton,Reiichiro Nakano,Christopher Hesse,John Schulman,John Schulman,John Schulman
Arxiv 2021,[Paper] [Github] [博客文章]
2021年11月18日
單人
將代數單詞問題解析到方程式中
Rik Koncel-Kedziorski,Hannaneh Hajishirzi,Ashish Sabharwal,Oren Etzioni,Siena Dumas Ang
TACL 2015,[Paper] [Gitlab]
2015年6月24日
AddSub :
學習解決動詞分類的算術單詞問題
Mohammad Javad Hosseini,Hannaneh Hajishirzi,Oren Etzioni,Nate Kushman
EMNLP 2014,[Paper] [Gitlab]
2014年10月25日
Multiarith :
解決一般算術單詞問題
丹·羅斯(Dan Roth)Subhro Roy
EMNLP 2015,[Paper] [網頁]
2015年9月17日
Aqua-Rat :
基本原理的計劃歸納:學習解決和解釋代數單詞問題
Wang Ling,Dani Yogatama,Chris Dyer,Phil Blunsom
ACL 2017,[Paper] [Github]
2017年7月30日
svamp :
NLP模型真的能夠解決簡單的數學單詞問題嗎?
Arkil Patel,Satwik Bhattamishra,Navin Goyal
NAACL 2021,[Paper] [Github]
2021年7月6日
阿斯迪夫:
一個多元化的語料庫,用於評估和開發英語數學單詞問題解決者
Shen-Yun Miao,Chao-Chun Liang,Keh-Yih Su
ACL 2020,[Paper] [Github]
2020年7月5日
CSQA :
CONSENSENSEQA:針對常識知識的一個問題回答挑戰
Alon Talmor,Jonathan Herzig,Nicholas Lourie,Jonathan Berant
NAACL 2019,[Paper] [網頁]
2019年3月15日
貝克:
貝爾:語言模型一致性評估的基準
Myeongjun Jang,Deuk Sin Kwon,Thomas Lukasiewicz
Coling 2022,[Paper] [Github]
2022年10月12日
解釋小隊的問題:
提高問答系統的魯棒性來提問釋義
Wee Chung Gan,hwee tou ng
ACL 2019,[Paper] [Github]
2019年7月28日
貝克:
貝爾:語言模型一致性評估的基準
Myeongjun Jang,Deuk Sin Kwon,Thomas Lukasiewicz
Coling 2022,[Paper] [Github]
2022年10月12日
LLM的多步推理中的兩次自洽的失敗
當歸Chen,Jason Phang,Alicia Parrish,Vishakh Padmakumar,Chen Zhao,Samuel R. Bowman,Kyunghyun Cho
Arxiv 2023,[紙]
2023年10月2日
MPARAREL :
Mpararel:多語言審慎語言模型的事實一致性
康斯坦扎·弗羅(Constanza Fierro),安德斯·索加德(AndersSøgaard)
ACL的發現:ACL 2022,[Paper] [GitHub]
2022年3月22日
Pararel :
Pararel:Metal ::測量和改善驗證的語言模型的一致性
Yanai Elazar,Nora Kassner,Shauli Ravfogel,Abhilasha Ravichander,Eduard Hovy,HinrichSchütze,Yoav Goldberg
TACL 2021,[Paper] [GitHub] [介紹]
2021年5月29日
數學示威者:逐步驗證和加強LLM,而無需人類註釋
Peiyi Wang,Lei Li,Zhihong Shao,RX Xu,Damai Dai,Yifei Li,Deli Chen,Y.WU,Zhifang Sui
Arxiv 2023,[紙]
2023年12月28日
基礎模型的推理調查
Jiankai Sun,Chuanyang Zheng,Enze Xie,Zhengying Liu,Ruihang Chu,Jianing Qiu,Jiaqi Xu,Mingyu ding,Hongyang Li,Mengzhe Geng,Yue Wu Ui Liu,Yu Li,Hao Dong,Yu Cheng,Ming Zhang,Pheng Ann Heng,Jifeng Dai,Ping Luo,Jingdong Wang,Ji-Rong Wen,Xipeng Qiu,Xipeng Qiu,Yike Guo,Hui Xiong,Qun Liu,Zhenguo Liu,Zhenguo li li li li li li li li li li li li li li li li
Arxiv 2023,[Paper] [Github]
2023年12月26日
查詢和響應增強無法幫助跨域數學推理概括
Chengpeng Li,Zheng Yuan,Hongyi Yuan,Guanting Dong,Keming Lu,Jiancan Wu,Chuanqi Tan,Xiang Wang,Chang Zhou
Arxiv 2023,[Paper] [Github]
2023年11月1日
metamath:引導自己的大語模型的數學問題
Longhui Yu,Weisen Jiang,Han Shi,Jincheng Yu,Zhengying Liu,Yu Zhang,James T. Kwok,Zhenguo Li,Adrian Weller,Weiyang Liu
Arxiv 2023,[Paper] [Github]
2023年10月9日
大型語言模型是具有自我驗證的更好的推理者
Yixuan Weng,Minjun Zhu,Fei Xia,Bin Li,Shizhu He,Shengping Liu,Bin Sun,Kang Liu,Jun Zhao
EMNLP 2023調查結果,[紙] [github]
2023年10月19日
使用語言模型提示推理:調查
Shuofei Qiao,Yixin OU,Ningyu Zhang,Xiang Chen,Yunzhi Yao,Shumin Deng,Chuanqi Tan,Fei Huang,Huajun Chen
ACL 2023,[Paper] [Github]
2023年9月18日
與大語言模型學習數學推理的擴展關係
Zheng Yuan,Hongyi Yuan,Chengpeng Li,Guanting Dong,Keming Lu,Chuanqi Tan,Chang Zhou,Jingren Zhou
Arxiv 2023,[Paper] [Github]
2023年8月3日
大型語言模型很容易被無關的環境分散注意力
Freda Shi,Xinyun Chen,Kanishka Misra,Nathan Scales,David Dohan,Ed Chi,NathanaelSchärli,Denny Zhou
ICML 2023,[Paper] [GitHub]
2023年6月6日
在大型語言模型中進行推理:一項調查
Jie Huang,Kevin Chen-Chuan Chang
ACL 2023的發現,[Paper] [Github]
2023年5月26日
自我refine:迭代精緻和自我反饋
Aman Madaan, Niket Tandon, Prakhar Gupta, Skyler Hallinan, Luyu Gao, Sarah Wiegreffe, Uri Alon, Nouha Dziri, Shrimai Prabhumoye, Yiming Yang, Shashank Gupta, Bodhisattwa Prasad Majumder, Katherine Hermann, Sean Welleck, Amir Yazdanbakhsh, Peter Clark
Arxiv 2023,[Paper] [GitHub] [網頁]
2023年5月25日
自我refine:迭代精緻和自我反饋
Aman Madaan, Niket Tandon, Prakhar Gupta, Skyler Hallinan, Luyu Gao, Sarah Wiegreffe, Uri Alon, Nouha Dziri, Shrimai Prabhumoye, Yiming Yang, Shashank Gupta, Bodhisattwa Prasad Majumder, Katherine Hermann, Sean Welleck, Amir Yazdanbakhsh, Peter Clark
Arxiv 2023,[Paper] [網站] [GitHub] [Demo]
2023年5月25日
讓我們逐步示例:自適應與LLM的有效推理
Pranjal Aggarwal,Aman Madaan,Yiming Yang,Mausam
Arxiv 2023,[Paper] [網站] [GitHub]
2023年5月19日
自諧情緒改善了語言模型中的思想推理鏈
Xuezhi Wang,Jason Wei,Dale Schuurmans,Quoc LE,Ed Chi,Sharan Narang,Aakanksha Chowdhery,Denny Zhou
ICLR 2023,[紙]
2023年3月7日
經過思考的鏈條提示在大語言模型中引起推理
Jason Wei,Xuezhi Wang,Dale Schuurmans,Maarten Bosma,Brian Ichter,Fei Xia,Ed Chi,Quoc LE,Denny Zhou
神經2022,[紙]
2022年1月28日
確保大語言模型可靠性的語義一致性
Harsh Raj,Vipul Gupta,Domenic Rosati,Subhabrata Majumdar
Arxiv 2023,[紙]
2023年8月17日
通過語義一致性來衡量大語言模型的可靠性
Harsh Raj,Domenic Rosati,Subhabrata Majumdar
ML安全研討會,神經2022,[紙]
2022年11月28日
零擊任務概括的迅速一致性
Chunting Zhou,Junxian HE,Xuezhe MA,Taylor Berg-Kirkpatrick,Graham Neubig
ACL的發現:EMNLP 2022,[Paper] [Github]
2022年12月27日
準確但不一致?語言理解模型的一致性分析
Myeongjun Jang,Deuk Sin Kwon,Thomas Lukasiewicz
Arxiv 2021,[紙]
2021年8月15日
語義相似性的演變 - 調查
Dhivya Chandrasekaran,Vijay Mago
ACM計算調查2021,[紙]
2021年1月30日
通過自然語言推論增強預訓練的語言模型的自洽性和表現
埃里克·米切爾(Eric Mitchell),約瑟夫·諾(Joseph Noh),西亞·李(Siyan Li)
EMNLP 2022,[Paper] [網站] [GitHub]
2022年11月21日
RCOT:通過逆轉思想鏈來檢測和糾正推理的事實不一致
天奇Xue,Ziqi Wang,Zhenhailong Wang,Chi Han,Pengfei Yu,Heng Ji
Arxiv 2023,[紙]
2023年10月2日
P-Audapters:從具有不同提示的語言模型中魯棒提取事實信息
本傑明·紐曼(Benjamin Newman),prafulla kumar choubey,nazneen rajani
ICLR 2022,[Paper] [Github]
2022年4月19日
我們怎麼知道語言模型知道什麼?
Zhengbao Jiang,Frank F. Xu,Jun Araki,Graham Neubig
TACL 2020,[Paper] [Github]
2020年5月3日
Biomedgpt:一種統一和通才的生物醫學生成培訓的預訓練的變壓器,用於視覺,語言和多模式任務
Kai Zhang,Jun Yu,Eashan Adhikarla,Rong Zhou,Zhiling Yan,Yixin Liu,Zhengliang Liu,Lifang HE,Brian Davison,Xiang Li,Hui Ren,Sunyang Fu Ongfang Liu,Lichao Sun
Arxiv 2024,[Paper] [Github]
2024年1月9日
大語言模型可以理解醫療問題嗎?
ValentinLiévin,Christoffer Egeberg Hother,Andreas Geert Motzfeldt,Ole Winther
Arxiv 2023,[Paper] [Github]
2023年12月24日
朝向通才生物醫學AI
陶tu,Shekoofeh Azizi,Danny Driess,Mike Schaekermann,Mohamed Amin,Pi-Chuan Chang,Andrew Carroll,Andrew Lau,Ryutaro Tanno,Ira Ktena,ira Ktena,Basil Mustafa,Basil Mustafa,Aakanksha Christopher Spsurs,S Sara Mahdavi,Bradley Green,Ewa Dominowska,Blaise Aguera Y Arcas,Joelle Barral,Dale Webster,Greg S. Corrado,Yossi Matias,Karan Singhal,Pete Florence,Pete Florence,Alan Karthikesalingam,Vivek Natarangan,
Arxiv 2023,[Paper] [Github]
2023年7月26日
LLAVA-MED:培訓一天之內的大型語言和視覺助手
Chunyuan Li,Cliff Wong,Sheng Zhang,Naoto Usuyama,Haotian Liu,Jianwei Yang,Tristan Naumann,Hoifung Poon,Jianfeng Gao
Arxiv 2023,[Paper] [Github]
2023年6月1日
邁向專家級的醫學問題,以大語言模型回答
Karan Singhal,Tao Tu,Juraj Gottweis,Rory Sayres,Ellery Wulczyn,Le Hou,Kevin Clark,Stephen Pfohl,Heather Cole-Lewis,Darlene Neal,Mike Schaekermn,Mike Schaekermann,Amy Wang,Mohamed Amin,Mohamed Amin,Sami Lachgar,Philip Manseeld,sushey sushe pra. CAS,Nenad Tomasev,Yun Liu,Renee Wong,Christopher Spers,S。SaraMahdavi,Joelle Barral,Dale Webster,Greg S. Corrado,Yossi Matias,Shekoofeh Azizi,Alan Karthikesalingam,Vivek Natarajanam
Arxiv 2023,[紙]
2023年5月16日
大型語言模型編碼臨床知識
Karan Singhal,Shekoofeh Azizi,Tao Tu,S。SaraMahdavi,Jason Wei,Jason Wei,Hyung贏得了Chung,Nathan Scales,Ajay Tanwani,Heather Cole-Lewis,Stephen Pfohl,Perry Payne Blaise Aguera Y Arcas,Dale Webster,Greg S. Corrado,Yossi Matias,Katherine Chou,Juraj Gottweis,Nenad Tomasev,Yun Liu,Alvin Rajkomar,Joelle Rajkomar,Joelle Barral,Christopher,Christopher Semturs,Alan Karthikesalingam,Vivek Natarakan natarajan
大自然,[紙]
2022年12月26日
多模式基礎模型:從專家到通用助手
Chunyuan Li,Zhe Gan,Zhengyuan Yang,Jianwei Yang,Linjie Li,Lijuan Wang,Jianfeng Gao
Arxiv 2023,[Paper] [網頁]
2023年9月18日