自然语言处理中的初学者资源列表
维护者
Dibya Chakravorty
贡献
随时发送拉动请求,或给我发送电子邮件([email protected])
这个列表如何开始
2016年11月10日,黑客新闻(HN)用户Aarohmankad向HN社区询问了有关初学者NLP资源的建议。此问HN线程变得很受欢迎,并在头版停留了一段时间。在这段时间里,它收集了有关初学者NLP资源的许多社区生成的建议。此列表试图将讨论汇总到一致的资源列表中。我还写了一篇博客文章。
目录
- 图书
- MOOC
- YouTube视频
- 在线大学课程
- 可以玩的包装
- 学术论文
- 通过做学习
- 开源项目
- 有趣的想法
- 蜜蜂
- 用户组
- 其他指南
图书
- 语音和语言处理:NLP中的经典和标准教科书。第三版前出版草案可在此处提供。
- 使用Python的自然语言处理:面向应用程序的书。示例在Python(NLTK)中。在这里免费的在线版本。
- 驯服文本:面向应用程序的书。例子在Java中。
- 统计自然语言处理的基础:统计NLP上的经典文本。深入实施解析器,标签者等。
- 自然语言处理手册:NLP的完整处理,始于历史根源,并以NLP的现代方法结束。
- 统计机器翻译:学习如何制作像Google翻译这样的服务
- 信息检索简介:了解Google搜索和Google新闻(搜索,文本分类,聚类等)等服务的螺栓和螺栓
- 序言和自然语言分析:在Prolog中实施NLP Algortihms。
MOOC
- 密歇根大学提供的Coursera课程:入门课程涵盖所有先决条件的材料。偏爱的编程语言是Python。
- Comlumbia University提供的Coursera课程,可在学术洪流上获得:理论和概念课程。此时只有课程材料可用。
YouTube视频
- Jurafsky和Martin的视频系列:Jurafsky和Martin都是Stanford的教授,他们在NLP上写了多本经典教科书。
- Stanford CS224D:NLP中的深度学习:NLP深度学习的应用
- NLP与Python和NLTK:使用Python和NLTK的面向应用程序的视频系列。
在线大学课程
可以玩的包装
- NLTK:Python中最受欢迎的NLP库。书籍/免费在线版本的形式出色的文档。强大而可扩展的。
- 斯坦福·科伦普(Stanford Corenlp):快速并提供用爪哇撰写的丰富的NLP图书馆。这里有在线演示。
- Spacy:Python的另一个新兴NLP库。快速和状态。在实施最新算法的同时,试图保持统一的API。他们有一个博客和在线演示。
- Apache Tika:提供了一个统一的接口,用于从许多不同的文件格式(PPT,PDF等)和分析中提取文本数据和元数据。
学术论文
- NLP中的深度学习:一种GITHUB回购,收集了NLP深度学习论文。
通过做学习
通常,学习的最佳方法是为现有的开源NLP项目做出贡献或实施有趣的想法。
开源项目
- 贝蒂:贝蒂(Betty)是一个开源项目,既有现实生活中的使用又是实用的NLP注意事项,并且正在寻找新的维护者。
有趣的想法
- 基于互动小说/解析器的小说:一个视频游戏,玩家的交互主要涉及文本。听这个关于该主题的启发性牙线播客。
蜜蜂
- IBM Watson Cloud:来自IBM Watson的制造商。它使您可以通过API在应用中集成NLP功能。有一个免费的层/免费试用。
用户组
- AI中的ACM特殊兴趣小组:如果您渴望面对人类接触。
其他指南
- Quora关于如何进入NLP的问题
- GITHUB上的Awesome-NLP:一个包含策划NLP资源列表的GitHub repo。