
变形金刚加速了自然语言处理(NLP)任务的新技术和模型的开发。尽管它主要用于NLP任务,但现在在其他领域(例如计算机视觉和增强学习)中看到了大量采用。这使其成为理解和能够应用的最重要的现代概念之一。
我知道许多机器学习,NLP学生和从业人员都热衷于学习变压器。因此,我已经准备了一份资源和研究材料列表形式的学习指南,以帮助指导学生有兴趣学习变形金刚世界的学生。
首先,我已经准备了一些材料的链接,这些链接我用来更好地理解和实现从头开始理解和实现变形金刚的模型。
首先,尝试获取有关变压器的高级介绍。一些值得一看的参考文献:
变压器简介 - 讲义(Elvis Saravia)
从头开始的变压器(布兰登·罗勒)
变形金刚在深度学习和NLP中的工作方式:直观的介绍(AI夏季)
Stanford CS25-变形金刚联合
深入学习语言理解(DeepMind)
变压器模型:简介和目录(Xavier amatriain)
杰伊·阿拉马(Jay Alammar)的插图解释是例外。一旦获得了对变形金刚的高级了解,您就可以进入这种流行的详细和插图的变压器解释:
插图的变压器
下一篇文章还将变形金刚分解为其组成部分,详细说明和说明了每个部分的作用:
分解变压器
在这一点上,您可能正在寻找变形金刚的技术摘要和概述。莉莲·旺(Lilian Weng)的博客文章是一颗宝石,并提供简洁的技术解释/摘要:
变压器家族
变压器家庭2.0版
在理论之后,测试知识很重要。我通常更喜欢更详细地了解事物,因此我更喜欢从头开始实现算法。对于实施变压器,我主要依靠本教程:
带注释的变压器| (Google colab | github)
使用nn.transformer和torchtext进行语言建模
如果您正在寻找一些最新的变压器上的深入实现,则可能还会找到具有有用的代码方法收集的论文。
Vaswani等人的本文。介绍了变压器体系结构。在您有高级理解并希望了解细节之后,请阅读它。请注意本文中的其他参考文献,以深入研究。
注意就是您所需要的
经过一段时间的研究和理解变压器背后的理论,您可能有兴趣将它们应用于不同的NLP项目或研究。目前,您最好的选择是HuggingFace的Transformers库。
变压器
拥抱面孔团队还与Transformers一起出版了一本关于NLP的新书,因此您可能需要在此处检查一下。
作为奖励,这是Sebastian Raschka在LLM上的出色阅读清单。
了解大型语言模型 - 变革性阅读清单
随意建议学习材料。在下一个更新中,我希望添加更全面的变压器应用程序和论文集合。此外,还将实现易于实验的代码实现。敬请关注!
要定期获取有关新ML和NLP资源的更新,请在Twitter上关注我。