大型語言模型是零彈性的時間序列預報員。神經2023。紙。代碼 Nate Gruver,Marc Finzi,Shikai Qiu,Andrew Gordon Wilson
培訓計算最佳的大語言模型。神經2022。紙。 喬丹·霍夫曼(Jordan Hoffmann),塞巴斯蒂安·博爾格(Sebastian Borgeaud),亞瑟·門施(Arthur Mensch),埃琳娜·布塔斯卡亞(Elena Buchatskaya),特雷弗·凱(Trevor Cai),伊麗莎·魯特福德(Eliza Rutherford),迭戈·德·拉斯·卡薩斯(Diego de Las Casas),麗莎·安妮·亨德里克斯(Lisa Anne Hendricks),約翰內斯·韋爾布爾(Johannes Welbl),艾滋病蓋伊(Guy),西蒙·奧西德(Simon Osindero),凱倫·西蒙納(Karen Simonyan),埃里希·埃爾森(Erich Elsen),傑克·雷(Jack W.
Llama-apapter:對語言模型的有效微調,並以零置的關注。 Arxiv 2023。紙。代碼 Zhang,Renrui和Han,Jiaming和Zhou,Aojun和Hu,Xiangfei和Yan,Shilin和Lu,Pan and Pan and Li,Hongsheng and Gao,Peng和Qiao,Yu,Yu