hands on nltk tutorial
1.0.0
Jupyter笔记本的形式的动手NLTK教程
NLTK是自然语言处理(NLP)最受欢迎的Python软件包之一。
| 笔记本 |
|---|
| 1.1下载libs并测试他们正在工作 准备开始! |
| 1.2使用NLTK.TEXT的文本分析 从给定文本中提取有趣的数据 |
| 2.1从文本得出n-grams 创建n-grams(用于语言分类) |
| 2.2通过计算停止单词来检测文本语言。IPYNB 一种简单的方法来找出文本写的语言 |
| 2.3使用单词bigrams的语言标识符 最先进的语言分类器 |
| 3.1大型,茎和诱人 NLTK制造大型,茎和咬合超级式的 |
| 3.2在给定语言中找到异常单词 哪个单词不属于其余文本? |
| 3.3创建POS标记器 创建语音标记器的一部分 |
| 3.4语音和含义的部分 探索WordNet提供的很棒的功能 |
| 4.1名称性别标识符 建立一个猜测名称性别的分类器 |
| 4.2将新闻文件分类为类别 构建一个猜测新闻类别的分类器 |
| 5.1情感分析 电影评论是正面还是负面? |
| 5.2 NLTK.Sentiment.Sentimentanalyzer和Vader工具的情感分析 更多的情感分析! |
| 6.1 Twitter流(和清洁推文) Twitter的现场流推文 |
| 6.2 Twitter搜索 搜索过去的推文 |
| 7.1 NLTK带希腊脚本 将NLTK与外国脚本一起使用 |
| 8.1 langdetect和langid库 语言标识的有用库 |
| 8.2 Word2Vec(Gensim) Google的Word2Vec |
HZ Sababa - HB20007 [email protected]
根据MIT许可分发。有关更多信息,请参见LICENSE 。