令人敬畏的LLM自愿:大语言模型中的自我一致性列表
该存储库称为LLMS的自偏见,其中包含有关大语言模型中自相连的资源和论文的集合。
“我看不到可以保证安全的道路。我们正在进入一个充满不确定性的时期,我们正在处理以前从未处理过的事情,而且我们无法承受这些事情的误解,因为它们可能会接管这些事情。
欢迎通过提交问题分享您的论文,想法和想法!
教语言模型推理
Denny Zhou,Google Deepmind
[关联]
2023年9月
人工通用情报的途径:对抗LLM对话的见解
爱德华Y.张
Socrasynth.com,[链接]
2024年3月
自然语言处理的基础模型:预先训练的语言模型集成媒体
GerhardPaaß,Sven Giesselbach
人工智能:基础,理论和算法(Springer自然),[链接]
2023年2月16日
GSM8K一致性:
GSM8K基准上算术推理的一致性
Shuyue Jia
拥抱脸2023,[拥抱脸] [github]
2023年12月1日
GSM8K :
培训验证者以解决数学单词问题
Karl Cobbe,Vineet Kosaraju,Mohammad Bavarian,Mark Chen,Heewoo Jun,Lukasz Kaiser,Matthias Plappert,Jerry Tworek,Jerry Tworek,Jacob Hilton,Reiichiro Nakano,Christopher Hesse,John Schulman,John Schulman,John Schulman
Arxiv 2021,[Paper] [Github] [博客文章]
2021年11月18日
单人
将代数单词问题解析到方程式中
Rik Koncel-Kedziorski,Hannaneh Hajishirzi,Ashish Sabharwal,Oren Etzioni,Siena Dumas Ang
TACL 2015,[Paper] [Gitlab]
2015年6月24日
AddSub :
学习解决动词分类的算术单词问题
Mohammad Javad Hosseini,Hannaneh Hajishirzi,Oren Etzioni,Nate Kushman
EMNLP 2014,[Paper] [Gitlab]
2014年10月25日
Multiarith :
解决一般算术单词问题
丹·罗斯(Dan Roth)Subhro Roy
EMNLP 2015,[Paper] [网页]
2015年9月17日
Aqua-Rat :
基本原理的计划归纳:学习解决和解释代数单词问题
Wang Ling,Dani Yogatama,Chris Dyer,Phil Blunsom
ACL 2017,[Paper] [Github]
2017年7月30日
svamp :
NLP模型真的能够解决简单的数学单词问题吗?
Arkil Patel,Satwik Bhattamishra,Navin Goyal
NAACL 2021,[Paper] [Github]
2021年7月6日
阿斯迪夫:
一个多元化的语料库,用于评估和开发英语数学单词问题解决者
Shen-Yun Miao,Chao-Chun Liang,Keh-Yih Su
ACL 2020,[Paper] [Github]
2020年7月5日
CSQA :
CONSENSENSEQA:针对常识知识的一个问题回答挑战
Alon Talmor,Jonathan Herzig,Nicholas Lourie,Jonathan Berant
NAACL 2019,[Paper] [网页]
2019年3月15日
贝克:
贝尔:语言模型一致性评估的基准
Myeongjun Jang,Deuk Sin Kwon,Thomas Lukasiewicz
Coling 2022,[Paper] [Github]
2022年10月12日
解释小队的问题:
提高问答系统的鲁棒性来提问释义
Wee Chung Gan,hwee tou ng
ACL 2019,[Paper] [Github]
2019年7月28日
贝克:
贝尔:语言模型一致性评估的基准
Myeongjun Jang,Deuk Sin Kwon,Thomas Lukasiewicz
Coling 2022,[Paper] [Github]
2022年10月12日
LLM的多步推理中的两次自洽的失败
当归Chen,Jason Phang,Alicia Parrish,Vishakh Padmakumar,Chen Zhao,Samuel R. Bowman,Kyunghyun Cho
Arxiv 2023,[纸]
2023年10月2日
MPARAREL :
Mpararel:多语言审慎语言模型的事实一致性
康斯坦扎·弗罗(Constanza Fierro),安德斯·索加德(AndersSøgaard)
ACL的发现:ACL 2022,[Paper] [GitHub]
2022年3月22日
Pararel :
Pararel:Metal ::测量和改善验证的语言模型的一致性
Yanai Elazar,Nora Kassner,Shauli Ravfogel,Abhilasha Ravichander,Eduard Hovy,HinrichSchütze,Yoav Goldberg
TACL 2021,[Paper] [GitHub] [介绍]
2021年5月29日
数学示威者:逐步验证和加强LLM,而无需人类注释
Peiyi Wang,Lei Li,Zhihong Shao,RX Xu,Damai Dai,Yifei Li,Deli Chen,Y.WU,Zhifang Sui
Arxiv 2023,[纸]
2023年12月28日
基础模型的推理调查
Jiankai Sun, Chuanyang Zheng, Enze Xie, Zhengying Liu, Ruihang Chu, Jianing Qiu, Jiaqi Xu, Mingyu Ding, Hongyang Li, Mengzhe Geng, Yue Wu, Wenhai Wang, Junsong Chen, Zhangyue Yin, Xiaozhe Ren, Jie Fu, Junxian He, Wu Yuan, Qi Liu, Xihui Liu, Yu Li, Hao Dong, Yu Cheng, Ming Zhang, Pheng Ann Heng, Jifeng Dai, Ping Luo, Jingdong Wang, Ji-Rong Wen, Xipeng Qiu, Yike Guo, Hui Xiong, Qun Liu, Zhenguo Li
Arxiv 2023,[Paper] [Github]
2023年12月26日
查询和响应增强无法帮助跨域数学推理概括
Chengpeng Li,Zheng Yuan,Hongyi Yuan,Guanting Dong,Keming Lu,Jiancan Wu,Chuanqi Tan,Xiang Wang,Chang Zhou
Arxiv 2023,[Paper] [Github]
2023年11月1日
metamath:引导自己的大语模型的数学问题
Longhui Yu,Weisen Jiang,Han Shi,Jincheng Yu,Zhengying Liu,Yu Zhang,James T. Kwok,Zhenguo Li,Adrian Weller,Weiyang Liu
Arxiv 2023,[Paper] [Github]
2023年10月9日
大型语言模型是具有自我验证的更好的推理者
Yixuan Weng,Minjun Zhu,Fei Xia,Bin Li,Shizhu He,Shengping Liu,Bin Sun,Kang Liu,Jun Zhao
EMNLP 2023调查结果,[纸] [github]
2023年10月19日
使用语言模型提示推理:调查
Shuofei Qiao,Yixin OU,Ningyu Zhang,Xiang Chen,Yunzhi Yao,Shumin Deng,Chuanqi Tan,Fei Huang,Huajun Chen
ACL 2023,[Paper] [Github]
2023年9月18日
与大语言模型学习数学推理的扩展关系
Zheng Yuan,Hongyi Yuan,Chengpeng Li,Guanting Dong,Keming Lu,Chuanqi Tan,Chang Zhou,Jingren Zhou
Arxiv 2023,[Paper] [Github]
2023年8月3日
大型语言模型很容易被无关的环境分散注意力
Freda Shi,Xinyun Chen,Kanishka Misra,Nathan Scales,David Dohan,Ed Chi,NathanaelSchärli,Denny Zhou
ICML 2023,[Paper] [GitHub]
2023年6月6日
在大型语言模型中进行推理:一项调查
Jie Huang,Kevin Chen-Chuan Chang
ACL 2023的发现,[Paper] [Github]
2023年5月26日
自我refine:迭代精致和自我反馈
Aman Madaan, Niket Tandon, Prakhar Gupta, Skyler Hallinan, Luyu Gao, Sarah Wiegreffe, Uri Alon, Nouha Dziri, Shrimai Prabhumoye, Yiming Yang, Shashank Gupta, Bodhisattwa Prasad Majumder, Katherine Hermann, Sean Welleck, Amir Yazdanbakhsh, Peter Clark
Arxiv 2023,[Paper] [GitHub] [网页]
2023年5月25日
自我refine:迭代精致和自我反馈
Aman Madaan, Niket Tandon, Prakhar Gupta, Skyler Hallinan, Luyu Gao, Sarah Wiegreffe, Uri Alon, Nouha Dziri, Shrimai Prabhumoye, Yiming Yang, Shashank Gupta, Bodhisattwa Prasad Majumder, Katherine Hermann, Sean Welleck, Amir Yazdanbakhsh, Peter Clark
Arxiv 2023,[Paper] [网站] [GitHub] [Demo]
2023年5月25日
让我们逐步示例:自适应与LLM的有效推理
Pranjal Aggarwal,Aman Madaan,Yiming Yang,Mausam
Arxiv 2023,[Paper] [网站] [GitHub]
2023年5月19日
自谐情绪改善了语言模型中的思想推理链
Xuezhi Wang,Jason Wei,Dale Schuurmans,Quoc LE,Ed Chi,Sharan Narang,Aakanksha Chowdhery,Denny Zhou
ICLR 2023,[纸]
2023年3月7日
经过思考的链条提示在大语言模型中引起推理
Jason Wei,Xuezhi Wang,Dale Schuurmans,Maarten Bosma,Brian Ichter,Fei Xia,Ed Chi,Quoc LE,Denny Zhou
神经2022,[纸]
2022年1月28日
确保大语言模型可靠性的语义一致性
Harsh Raj,Vipul Gupta,Domenic Rosati,Subhabrata Majumdar
Arxiv 2023,[纸]
2023年8月17日
通过语义一致性来衡量大语言模型的可靠性
Harsh Raj,Domenic Rosati,Subhabrata Majumdar
ML安全研讨会,神经2022,[纸]
2022年11月28日
零击任务概括的迅速一致性
Chunting Zhou,Junxian HE,Xuezhe MA,Taylor Berg-Kirkpatrick,Graham Neubig
ACL的发现:EMNLP 2022,[Paper] [Github]
2022年12月27日
准确但不一致?语言理解模型的一致性分析
Myeongjun Jang,Deuk Sin Kwon,Thomas Lukasiewicz
Arxiv 2021,[纸]
2021年8月15日
语义相似性的演变 - 调查
Dhivya Chandrasekaran,Vijay Mago
ACM计算调查2021,[纸]
2021年1月30日
通过自然语言推论增强预训练的语言模型的自洽性和表现
埃里克·米切尔(Eric Mitchell),约瑟夫·诺(Joseph Noh),西亚·李(Siyan Li)
EMNLP 2022,[Paper] [网站] [GitHub]
2022年11月21日
RCOT:通过逆转思想链来检测和纠正推理的事实不一致
天奇Xue,Ziqi Wang,Zhenhailong Wang,Chi Han,Pengfei Yu,Heng Ji
Arxiv 2023,[纸]
2023年10月2日
P-Audapters:从具有不同提示的语言模型中鲁棒提取事实信息
本杰明·纽曼(Benjamin Newman),prafulla kumar choubey,nazneen rajani
ICLR 2022,[Paper] [Github]
2022年4月19日
我们怎么知道语言模型知道什么?
Zhengbao Jiang,Frank F. Xu,Jun Araki,Graham Neubig
TACL 2020,[Paper] [Github]
2020年5月3日
Biomedgpt:一种统一和通才的生物医学生成培训的预训练的变压器,用于视觉,语言和多模式任务
Kai Zhang, Jun Yu, Eashan Adhikarla, Rong Zhou, Zhiling Yan, Yixin Liu, Zhengliang Liu, Lifang He, Brian Davison, Xiang Li, Hui Ren, Sunyang Fu, James Zou, Wei Liu, Jing Huang, Chen Chen, Yuyin Zhou, Tianming Liu, Xun Chen, Yong Chen, Quanzheng Li,Hongfang Liu,Lichao Sun
Arxiv 2024,[Paper] [Github]
2024年1月9日
大语言模型可以理解医疗问题吗?
ValentinLiévin,Christoffer Egeberg Hother,Andreas Geert Motzfeldt,Ole Winther
Arxiv 2023,[Paper] [Github]
2023年12月24日
朝向通才生物医学AI
陶托,shekoofeh azizi,丹尼·德里斯,迈克·谢克曼,穆罕默德·阿明,彼 - 尚·张,安德鲁·卡罗尔,安德鲁·卡罗尔,查克·劳,瑞塔·塔诺,伊拉·肯塔纳,伊拉·肯塔纳,巴萨尔·穆斯塔法,巴萨尔·穆斯塔法,阿卡克斯沙·乔德利,Yuni liuu,Yunliu,Yunon Korniip,Simon Korniip Prakane wonghip worniip worniip worniip wornew field wood, Sunny Virmani,Christopher Spers,S Sara Mahdavi,Bradley Green,Ewa Dominowska,Blaise Aguera Y Arcas,Joelle Barral,Dale Webster,Greg S. Corrado,Yossi Matias,Yossi Matias,Karan Singhal,Pete Florence,Pete Florence,Alan Karthikesalingam,Vivek Natarajan
Arxiv 2023,[Paper] [Github]
2023年7月26日
LLAVA-MED:培训一天之内的大型语言和视觉助手
Chunyuan Li,Cliff Wong,Sheng Zhang,Naoto Usuyama,Haotian Liu,Jianwei Yang,Tristan Naumann,Hoifung Poon,Jianfeng Gao
Arxiv 2023,[Paper] [Github]
2023年6月1日
迈向专家级的医学问题,以大语言模型回答
Karan Singhal, Tao Tu, Juraj Gottweis, Rory Sayres, Ellery Wulczyn, Le Hou, Kevin Clark, Stephen Pfohl, Heather Cole-Lewis, Darlene Neal, Mike Schaekermann, Amy Wang, Mohamed Amin, Sami Lachgar, Philip Mansfield, Sushant Prakash, Bradley Green, Ewa Dominowska, Blaise Aguera Y Arcas,Nenad Tomasev,Yun Liu,Renee Wong,Christopher Spurs,S。SaraMahdavi,Joelle Barral,Joelle Barral,Dale Webster,Greg S. Corrado,Yossi Matias,Shekoofeh Azizi,Alan Karthikesalingam,Vivek natarakan nataarajan,
Arxiv 2023,[纸]
2023年5月16日
大型语言模型编码临床知识
Karan Singhal, Shekoofeh Azizi, Tao Tu, S. Sara Mahdavi, Jason Wei, Hyung Won Chung, Nathan Scales, Ajay Tanwani, Heather Cole-Lewis, Stephen Pfohl, Perry Payne, Martin Seneviratne, Paul Gamble, Chris Kelly, Nathaneal Scharli, Aakanksha Chowdhery,菲利普·曼斯菲尔德(Philip Mansfield),布莱斯·阿格拉(Blaise Aguera Y Arcas),戴尔·韦伯斯特(Dale Webster),格雷格·S·柯拉多(Greg S. Corrado),Yossi Matias,Katherine Chou,Juraj Gottweis,Nenad Tomasev,Yun Liu,Alvin Rajkomar,Joelle Barral,Joelle Barral,Christopher,Christopher,Christopher,Alan KarthikeSalingam,Vivek Natarajan Natarajan
大自然,[纸]
2022年12月26日
多模式基础模型:从专家到通用助手
Chunyuan Li,Zhe Gan,Zhengyuan Yang,Jianwei Yang,Linjie Li,Lijuan Wang,Jianfeng Gao
Arxiv 2023,[Paper] [网页]
2023年9月18日