nlp_fundamentals
1.0.0
(正在进行中工作!)
自然语言处理(NLP)在过去几年中取得了重大进步,这是由于基于深度学习的现代技术的成功。随着NLP的受欢迎程度的兴起以及不同形式的大规模数据的可用性,从第一原则中了解NLP技术和概念的内部运作是更加必要的,因为它们从第一原则中找到了他们进入实际影响社会的现实世界使用和应用程序。建立直觉和对概念的牢固掌握对于提出创新技术,改进研究以及建立安全,以人为以人为本的AI和NLP技术都很重要。
我们介绍了一个名为NLP基础知识的新系列,我们旨在教授重要的NLP技术和概念,从第一原则开始。我们将介绍整个系列涵盖的每个概念的理论方面和动机。然后,我们将通过使用Bootstrap方法,行业标准工具和其他开源库来获得实践经验,以实施不同的技术。在此过程中,我们还将涵盖最佳实践,分享重要的参考,指出训练和构建NLP模型时要避免的常见错误,并讨论未来的情况。
加入我们的Slack社区,找到更多有关此项目和其他正在进行的项目的更多信息。随时在Twitter上与我接触,以邀请我们的Slack小组。
第1章:象征化,lemmatization,stemming和句子细分 - COLAB笔记本,网络版本
nlp_fundamentals标签。 good first issue标签的问题是入门的好任务。