
- 有关完整的数据科学任务,材料等。请检查数据科学存储库。
- 对于机器学习算法,请检查机器学习存储库。
- 有关深度学习算法,请检查深度学习存储库。
- 有关计算机视觉,请检查计算机视觉存储库。
具有特定任务/域的所有材料的文件夹
现代的NLP技术从复发的神经网络和单词嵌入到变形金刚和自我注意力。涵盖了应用主题,例如回答和文本生成。
这是在Yandex数据分析学院(YSDA)教授的(ML)自然语言处理课程的扩展。目前,这里可能只涵盖部分主题。
本课程将涵盖搜索引擎技术,这些技术在涉及文本数据的任何数据挖掘应用程序中都起着重要作用,原因有两个。首先,尽管对于任何特定问题,原始数据可能很大,但它通常是相关数据的一个相对较小的子集,并且搜索引擎是快速在大型文本集合中快速发现相关文本数据的一小部分的必不可少的工具。其次,需要搜索引擎来帮助分析师通过允许它们检查相关的原始文本数据以了解任何发现的模式来解释数据中发现的任何模式。您将学习文本检索中的基本概念,原理和主要技术,即搜索引擎的基础科学。
O'Reilly Media的“实用自然语言处理”的官方存储库
可作为书籍提供:python中的NLP- Quickstart Guide
| 标题 | 描述 |
|---|---|
| ACL | 在Vimeo |
| [Stanford CS224N:深度学习的自然语言处理 | 冬季2021](https://www.youtube.com/playlist?list=ploromvodv4rosh4v6133s9lfprhjembmj) |
| 自然语言处理(NLP)为零 | 通过TensorFlow |
| 零与英雄:NLP与Tensorflow和Keras(GDG Sofia Meetup) | |
| 自然语言处理 | 该内容基于机器学习大学(MLU)加速自然语言处理类别。幻灯片,笔记本和数据集可在GitHub上找到 |
我是Google的研究科学家。我博客有关自然语言处理和机器学习。
精心策划的工程博客清单
梯度是一个组织,其任务是使任何人更容易了解AI并促进AI社区中的讨论。我们是由斯坦福AI实验室的一群学生和研究人员于2017年成立的。
| 标题 | 描述 |
|---|---|
| NVIDIA的深度学习示例 - 自然语言处理 | 深度学习的例子 |
| 使用变压器的自然语言处理 | O'Reilly书的笔记本和材料“与变压器的自然语言处理” |
| 很棒的NLP参考 | 精心策划的资源清单,用于知识蒸馏,推荐系统,尤其是自然语言处理(NLP) |
| NLP-教程 | |
| 自然语言过程教程 | |
| NLP与Python | Scikit-Learn,NLTK,Spacy,Gensim,Textblob等... |
| NLP和数据科学GITHUB存储库聚光灯 | 一些被低估的NLP和数据科学GITHUB存储库的日常聚光灯。 |
| NLP 101:用于深度学习和自然语言处理的资源存储库 | 该文档是为那些热情地学习自然语言处理的人而起草的。如果有任何好的建议或建议,我将尝试添加更多。 |
| NLP-Progress | 存储库跟踪自然语言处理的进度(NLP),包括数据集和最常见的NLP任务的当前最新设备。 |
| 拥抱脸 | HF博客文章的公共回购 |
| Allennlp | 开源NLP研究库,建于Pytorch。 allenai.org |
NLP库,框架,模块
| 标题 | 描述 |
|---|---|
| 自然语言工具包(NLTK) | NLTK-自然语言工具包 - 是一套开源Python模块,数据集和支持自然语言处理研究和开发的教程的套件。 |
| 天赋 |
最先进的自然语言处理(NLP)的非常简单的框架。 Flair是: |
| 文字 | textacy是一个用于执行各种自然语言处理(NLP)任务的Python库,该任务是建立在高性能Spacy库上的。有了基本原理 - 词组化,词性标记,依赖性解析等----委派给另一个库, textacy主要集中于以前的任务并遵循。 |
| Allennlp | NLP研究库建立在Pytorch上,用于开发有关各种语言任务的最新深度学习模型。 |
| nlpgym | NLPGYM是弥合RL和NLP应用之间差距的工具包。这旨在促进DRL在自然语言处理任务上的研究和基准测试。该工具包为标准NLP任务(例如序列标签,问答和序列分类)提供交互式环境。 |
| Gensim |
| 标题 | 描述 |
|---|---|
| NLP教程 | 深度学习研究人员的自然语言处理教程
|
| Python教程中的自然语言处理 | 使用自然语言处理比较站立喜剧演员 |
? 100条必须阅读的NLP论文
?科学枢纽(论文)
?斯坦福大学NLP研讨会时间表
? CS224N:深度学习的自然语言处理
? CIS 700-008-互动小说和文本生成
?哈佛NLP
?插图的变压器
实施了双向注意力流神经网络作为小队的基准,改善了克里斯·乔特(Chris Chute)的模型实现,添加了原始论文中所述的单词字符输入并改善了Gauthierdmns的代码。