大型语言模型是零弹性的时间序列预报员。神经2023。纸。代码 Nate Gruver,Marc Finzi,Shikai Qiu,Andrew Gordon Wilson
培训计算最佳的大语言模型。神经2022。纸。 乔丹·霍夫曼(Jordan Hoffmann),塞巴斯蒂安·博尔格(Sebastian Borgeaud),亚瑟·门施(Arthur Mensch),埃琳娜·布塔斯卡亚(Elena Buchatskaya),特雷弗·凯(Trevor Cai),伊丽莎·鲁特福德(Eliza Rutherford),迭戈·德·拉斯·卡萨斯(Diego de Las Casas),丽莎·安妮·亨德里克斯(Lisa Anne Hendricks),约翰内斯·韦尔布尔(Johannes Welbl),艾滋病盖伊(Guy),西蒙·奥西德(Simon Osindero),凯伦·西蒙纳(Karen Simonyan),埃里希·埃尔森(Erich Elsen),杰克·雷(Jack W.
Llama-apapter:对语言模型的有效微调,并以零置的关注。 Arxiv 2023。纸。代码 Zhang,Renrui和Han,Jiaming和Zhou,Aojun和Hu,Xiangfei和Yan,Shilin和Lu,Pan and Pan and Li,Hongsheng and Gao,Peng和Qiao,Yu,Yu