LLMsPracticalGuide下载LLMsPracticalGuide源代码下载

LLMsPracticalGuide

其他源码

1.0.0

下载

大型语言模型的实用指南

LLMS实用指南资源的策划（仍在积极更新）列表。它基于我们的调查论文：利用LLM的实践力量：Chatgpt及其境内的调查以及@xinyadu的努力。该调查部分基于此博客的后半部分。我们还建立了一棵现代大型语言模型（LLM）的进化树，以追踪近年来语言模型的发展，并突出显示一些最著名的模型。

这些资料旨在帮助从业者浏览大语言模型（LLM）的广阔景观及其在自然语言处理（NLP）应用中的应用。我们还根据模型和数据许可信息包括他们的使用限制。如果您在我们的存储库中发现任何资源有帮助，请随时使用它们（不要忘记引用我们的论文！？）。我们欢迎拉动请求来完善这个数字！

    @article { yang2023harnessing ,
        title = { Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond } , 
        author = { Jingfeng Yang and Hongye Jin and Ruixiang Tang and Xiaotian Han and Qizhang Feng and Haoming Jiang and Bing Yin and Xia Hu } ,
        year = { 2023 } ,
        eprint = { 2304.13712 } ,
        archivePrefix = { arXiv } ,
        primaryClass = { cs.CL }
    }

LLMS的其他实用指南

为什么GPT-3的所有公共繁殖都失败了？我们应该在哪些任务中使用GPT-3.5/CHATGPT？ 2023年，博客
建立生产的LLM应用程序，2023年，博客
以数据为中心的人工智能，2023年，回购/博客/纸

大型语言模型的实用指南
- 模型实用指南
  - Bert风格的语言模型：编码器或仅编码器
  - GPT风格的语言模型：仅解码器
- 数据实用指南
  - 预处理数据
  - 鉴定数据
  - 测试数据/用户数据
- NLP任务的实用指南
  - 传统的NLU任务
  - 一代任务
  - 知识密集型任务
  - 缩放能力
  - 特定任务
  - 现实世界的“任务”
  - 效率
  - 值得信赖
  - 基准指令调整
  - 结盟
    - 安全对准（无害）
    - 真实对准（诚实）
    - 提示的实用指南（有用）
    - 开源社区的一致性
- 用法和约束（模型和数据）

模型实用指南

Bert风格的语言模型：编码器或仅编码器

伯特·伯特（Bert Bert）：深层双向变压器的预培训，以了解语言理解，2018年，论文
罗伯塔·罗伯塔（Roberta Roberta）：一种强大优化的伯特预审计方法，2019年，纸张
Distilbert Distilbert，Bert的蒸馏版：较小，更快，更便宜，更轻，2019年，纸
阿尔伯特·阿尔伯特（Albert Albert）：一个用于自我监督语言表示学习的精简版，2019年，纸张
Unilm Unilm Unified语言模型预培训用于自然语言理解和发电，2019年论文
Electra Electra：训练前文本编码作为鉴别器而不是发电机，2020年，纸
T5 “使用统一的文本到文本变压器探索转移学习的极限” 。 Colin Raffel等。 JMLR2019。论文
GLM “ GLM-130B：开放的双语预训练模型” 。 2022。纸
Alexatm “ Alexatm 20b：使用大型多语言SEQ2SEQ模型进行了很少的学习” 。 Saleh Soltan等。 Arxiv 2022。纸
St-Moe St-Moe：设计稳定且可转移的稀疏专家模型。 2022纸

GPT风格的语言模型：仅解码器

GPT通过生成的预训练来改善语言理解。 2018。纸
GPT-2语言模型是无监督的多任务学习者。 2018。纸
GPT-3 “语言模型是很少的学习者” 。神经2020。纸
OPT “ OPT：打开预训练的变压器语言模型” 。 2022。纸
棕榈“棕榈：使用途径的缩放语言建模” 。 Aakanksha Chowdhery等。 Arxiv 2022。纸
布鲁姆“盛开：176b参数开放式访问多语言模型” 。 2022。纸
MT-NLG “使用DeepSpeed和Megatron训练Megatron-Tring NLG 530B，这是一种大规模的生成语言模型” 。 2021。纸
Glam “ Glam：具有专家混合物的语言模型的有效缩放” 。 ICML 2022。纸
Gopher “缩放语言模型：训练Gopher的方法，分析和见解” 。 2021。纸
Chinchilla “训练译文最佳的大语言模型” 。 2022。纸
LAMDA “ LAMDA：对话应用程序的语言模型” 。 2021。纸
骆驼“骆驼：开放有效的基础语言模型” 。 2023。纸
GPT-4 “ GPT-4技术报告” 。 2023。纸
Bloomberggpt Bloomberggpt：金融大型语言模型，2023年，纸
GPT-NEOX-20B： “ GPT-NEOX-20B：开放式自回归语言模型” 。 2022。纸
棕榈2： “ Palm 2技术报告” 。 2023。Tech.Report
骆驼2： “骆驼2：开放基础和微调的聊天模型” 。 2023。纸
克劳德2： “克劳德模型的模型卡和评估” 。 2023。型号卡

数据实用指南

预处理数据

Redpajama ，2023年。
堆：一个800GB的语言建模文本数据集，Arxiv 2020。
训练前的目标如何影响大型语言模型对语言特性的了解？ ，ACL 2022。纸
神经语言模型的缩放法律，2020年。
以数据为中心的人工智能：调查，2023年。
GPT如何获得其能力？将语言模型的紧急能力追溯到其来源，2022年。博客。

鉴定数据

基准测试零击文本分类：数据集，评估和索引方法，EMNLP 2019。
语言模型是很少的学习者，nips 2020。
LLM的合成数据生成有助于临床文本挖掘吗？ Arxiv 2023纸

测试数据/用户数据

自然语言理解中大型语言模型的快捷方式学习：调查，Arxiv 2023。
关于Chatgpt的鲁棒性：对抗性和分发视角Arxiv，2023年。
Superglue：通用语言理解系统ARXIV 2019的粘性基准。

NLP任务的实用指南

我们为选择LLM或微调模型〜 protect footnotemark构建决策流，用于用户的NLP应用程序。决策流帮助用户评估其下游的NLP应用程序是否符合特定条件，并基于该评估，确定LLMS或微型模型是否是其应用程序最合适的选择。

传统的NLU任务

关于民事评论的有毒评论分类的基准数据集Arxiv 2023论文
chatgpt是通用的自然语言处理任务求解器吗？ Arxiv 2023 Paper
新闻摘要的大型语言模型Arxiv 2022纸

一代任务

新闻摘要和评估GPT-3 Arxiv 2022纸
chatgpt是一个好翻译吗？是的，GPT-4作为引擎ARXIV 2023纸
Microsoft的多语言机器翻译系统，用于WMT21共享任务，WMT2021纸
Chatgpt也可以理解吗？一项关于Chatgpt和微调Bert的比较研究，Arxiv 2023，纸

知识密集型任务

测量大量的多任务语言理解，ICLR 2021纸
超越模仿游戏：量化和推断语言模型的功能，arxiv 2022纸
逆缩放奖，2022链接
Atlas：带有检索增强语言模型的很少的学习，Arxiv 2022纸
大型语言模型编码临床知识，ARXIV 2022纸

缩放能力

培训计算最佳的大语言模型，神经2022纸
神经语言模型的缩放法律，Arxiv 2020纸张
解决基于过程和基于结果的反馈的数学单词问题，ARXIV 2022纸
思想链促使人们在大语模型中引发推理，神经2022纸
大型语言模型的紧急能力，TMLR 2022纸
逆缩放可以变成U形，Arxiv 2022纸
在大型语言模型中进行推理：调查，ARXIV 2022纸

特定任务

作为外语的图像：为所有视觉和视觉语言任务进行预告，Arixv 2022纸
巴利人：共同刻度的多语言图像模型，Arxiv 2022纸
Augg：利用Chatgpt进行文本数据扩展，ARXIV 2023纸
GPT-3是一个好的数据注释器吗？ ，Arxiv 2022纸
想降低标签成本吗？ GPT-3可以帮助，EMNLP调查结果2021纸
GPT3MIX：利用大型语言模型进行文本增强，EMNLP调查2021纸
用于患者试验匹配的LLM：隐私感知的数据增强，以提高性能和推广性，ARXIV 2023纸
CHATGPT的表现优于文本宣传任务的众劳工，ARXIV 2023纸
G-eval：使用GPT-4具有更好的人类对齐方式的NLG评估，Arxiv 2023纸
GPTSCORE：根据您想要的评估，Arxiv 2023纸
大型语言模型是翻译质量的最新评估者，Arxiv 2023纸
chatgpt是一个不错的NLG评估员吗？初步研究，Arxiv 2023纸

现实世界的“任务”

人工通用智能的火花：GPT-4的早期实验，ARXIV 2023纸

效率

成本

OpenAI的GPT-3语言模型：技术概述，2020年。博客文章
在云实例中测量AI的碳强度，FACCT 2022。
在AI中，更大总是更好吗？ ，自然第2023条。
语言模型是很少的学习者，神经2020。
定价，Openai。博客文章

潜伏期

掌舵：语言模型的整体评估，Arxiv 2022。

参数有效的微调

洛拉：大语言模型的低排名，Arxiv 2021。
前缀调整：优化发电的连续提示，ACL 2021。
p调节：及时调整可以与跨尺度和任务的微调相提并论，ACL 2022。纸张。
p-Tuning V2：及时调整可以与跨尺度和任务普遍普遍的微调相提并论，arxiv 2022。

预训练系统

零：训练数万亿参数模型的内存优化，Arxiv 2019。
Megatron-LM：使用模型并行培训数十亿个参数语言模型，Arxiv 2019。
使用Megatron-LM，Arxiv 2021的高效大规模语言模型培训。
减少大型变压器模型中的激活重新计算，Arxiv 2021。

值得信赖

稳健性和校准

使用前校准：提高语言模型的少量性能，ICML 2021。
规格：一种基于软及时的校准，用于减轻临床注释中的性能变异性，ARXIV 2023。

虚假偏见

大型语言模型可能是懒惰的学习者：分析贴上文字学习的快捷方式，ACL 2023纸的发现
自然语言理解中大型语言模型的快捷方式学习：调查，2023年论文
在字幕系统中缓解性别偏见，www 2020纸
使用前校准：提高语言模型的少量性能，ICML 2021纸
深度神经网络中的快捷方式学习，自然机器智能2020纸
基于及时的模型是否真的了解其提示的含义？ ，NAACL 2022纸

安全问题

GPT-4系统卡，2023纸
检测LLM生成文本的科学，Arxiv 2023纸
如何通过语言共享刻板印象：审查和介绍大型类别和刻板印象的通信（SCSC）框架，通信研究审查，2019年论文
性别阴影：商业性别分类中的交叉准确性差异，FACCT 2018论文

基准指令调整

Flan：固定语言模型是零拍的学习者，ARXIV 2021纸
T0：多任务提示培训可以启用零击任务概括，ARXIV 2021纸
通过自然语言众包说明的跨任务概括，ACL 2022纸
TK-Instruct： Super-Naturalinstructions：通过声明说明进行1600+ NLP任务的概括，EMNLP 2022纸
Flan-T5/Palm：缩放指令 - 填充语言模型，Arxiv 2022纸
Flan Collection：设计有效说明调整的数据和方法，ARXIV 2023纸
OPT-IML：缩放语言模型指令通过概括的镜头元学习，Arxiv 2023纸

结盟

从人类的偏好中学习深度加强，NIPS 2017论文
学会从人类反馈中总结，arxiv 2020纸
作为对齐实验室的一般语言助理，ARXIV 2021纸
通过从人类反馈中学习的强化学习，培训有用且无害的助手，Arxiv 2022纸
教学语言模型以验证的报价支持答案，arxiv 2022纸
指示：培训语言模型遵循人为反馈的指示，ARXIV 2022纸
通过有针对性的人类判断提高对话代理的对准，ARXIV 2022纸
奖励模型过度分配的缩放定律，Arxiv 2022纸
可扩展监督：衡量大型语言模型可扩展监督的进度，ARXIV 2022纸

安全对准（无害）

使用语言模型的红色小组语言模型，ARXIV 2022纸
宪法AI：AI反馈的无害性，ARXIV 2022纸
大语模型中道德自我纠正的能力，Arxiv 2023纸
Openai：我们对AI安全的方法，2023博客

真实对准（诚实）

语言模型的强化学习，2023博客

提示的实用指南（有用）

Openai食谱。博客
及时的工程。博客
chatgpt提示开发人员工程！课程

开源社区的一致性

自我建造：与自我生成的说明的对齐语言模型，Arxiv 2022纸
羊驼。仓库
维库纳。仓库
多莉。博客
深速chat 。博客
GPT4ALL 。仓库
开放态度。仓库
chatglm 。仓库
苔藓。仓库
拉米尼。 repo/blog

用法和限制

我们构建了一个总结LLMS使用限制的表（例如，用于商业和研究目的）。特别是，我们从模型及其预处理数据的角度提供信息。我们敦促社区中的用户参考公共模型和数据的许可信息，并以负责任的方式使用它们。我们敦促开发人员特别注意许可，使他们透明和全面，以防止任何不必要的和无法预料的用法。

LLMS	模型			数据
	执照	商业用途	其他明显的限制	执照	语料库
仅编码
BERT系列模型（通用域）	Apache 2.0	✅		民众	Bookscorpus，英语Wikipedia
罗伯塔	麻省理工学院许可证	✅		民众	BookCorpus，CC-News，OpenWebText，故事
厄尼	Apache 2.0	✅		民众	英语维基百科
Scibert	Apache 2.0	✅		民众	伯特语料库，语义学者114万篇论文
Legalbert	CC BY-SA 4.0			公共（判例法访问项目的数据除外）	欧盟立法，美国法院案件等
生物Biobert	Apache 2.0	✅		PubMed	PubMed，PMC
编码器
T5	Apache 2.0	✅		民众	C4
Flan-T5	Apache 2.0	✅		民众	C4，任务的混合物（图2中的图2）
巴特	Apache 2.0	✅		民众	罗伯塔语料库
Glm	Apache 2.0	✅		民众	bookscorpus和英语维基百科
chatglm	chatglm许可证		无用于非法目的或军事研究，不会损害社会的公共利益	N/A。	中文和英语语料库的1T令牌
仅解码
GPT2	修改后的MIT许可证	✅	负责任地使用GPT-2，并清楚地表明您的内容是使用GPT-2创建的。	民众	WebText
gpt-neo	麻省理工学院许可证	✅		民众	桩
GPT-J	Apache 2.0	✅		民众	桩
--->多莉	CC由NC 4.0			CC由NC 4.0，遵守OpenAI生成的数据的使用条款	堆，自我指导
---> gpt4all-j	Apache 2.0	✅		民众	GPT4ALL-J数据集
毕田	Apache 2.0	✅		民众	桩
---> Dolly V2	麻省理工学院许可证	✅		民众	堆，数据映 - dolly-15k
选择	OPT-175B许可协议		没有与监视研究和军事有关的发展，也不会损害社会的公共利益	民众	Roberta Corpus，堆，PushShift.io reddit
---> opt-iml	OPT-175B许可协议		同样选择	民众	Opt copus，超简短结构的扩展版本
YALM	Apache 2.0	✅		未指定	堆，团队收集了俄语的文字
盛开	Bigscience Rail许可证	✅	无需使用可危害他人的目的来生成虚假信息；内容没有明确否认文本是机器生成的	民众	Roots copus（Lauren≥Con等，2022）
---> Bloomz	Bigscience Rail许可证	✅	也很开心	民众	根语料库，xp3
银河系	CC BY-NC 4.0			N/A。	Galactica语料库
骆驼	非商业定制许可证		没有与监视研究和军事有关的发展，也不会损害社会的公共利益	民众	CommonCrawl，C4，Github，Wikipedia等。
--->羊驼	CC由NC 4.0			CC由NC 4.0，遵守OpenAI生成的数据的使用条款	Llama语料库，自我指导
--->维库纳	CC由NC 4.0			遵守OpenAI生成的数据的使用条款；共享的隐私惯例	Llama语料库，ShareGPT.com的70k对话
---> gpt4All	GPL许可的骆驼			民众	GPT4ALL数据集
Ottinllama	Apache 2.0	✅		民众	Redpajama
Codegeex	Codegeex许可证		无用于非法目的或军事研究	民众	堆，codeparrot，等。
Starcoder	BigCode OpenRail-M V1许可证	✅	无需使用可危害他人的目的来生成虚假信息；内容没有明确否认文本是机器生成的	民众	堆栈
MPT-7B	Apache 2.0	✅		民众	MC4（英语），堆栈，Redpajama，S2orc
鹘	TII Falcon LLM许可证	✅/	根据允许商业用途的许可证可用	民众	精制网络

星历史

展开

附加信息

版本 1.0.0
类型其他源码
更新时间 2025-04-16
大小 10.67MB
来自于 Github

LLMsPracticalGuide