hands on nltk tutorial
1.0.0
Jupyter筆記本的形式的動手NLTK教程
NLTK是自然語言處理(NLP)最受歡迎的Python軟件包之一。
| 筆記本 |
|---|
| 1.1下載libs並測試他們正在工作 準備開始! |
| 1.2使用NLTK.TEXT的文本分析 從給定文本中提取有趣的數據 |
| 2.1從文本得出n-grams 創建n-grams(用於語言分類) |
| 2.2通過計算停止單詞來檢測文本語言。 IPYNB 一種簡單的方法來找出文本寫的語言 |
| 2.3使用單詞bigrams的語言標識符 最先進的語言分類器 |
| 3.1大型,莖和誘人 NLTK製造大型,莖和咬合超級式的 |
| 3.2在給定語言中找到異常單詞 哪個單詞不屬於其余文本? |
| 3.3創建POS標記器 創建語音標記器的一部分 |
| 3.4語音和含義的部分 探索WordNet提供的很棒的功能 |
| 4.1名稱性別標識符 建立一個猜測名稱性別的分類器 |
| 4.2將新聞文件分類為類別 構建一個猜測新聞類別的分類器 |
| 5.1情感分析 電影評論是正面還是負面? |
| 5.2 NLTK.Sentiment.Sentimentanalyzer和Vader工具的情感分析 更多的情感分析! |
| 6.1 Twitter流(和清潔推文) Twitter的現場流推文 |
| 6.2 Twitter搜索 搜索過去的推文 |
| 7.1 NLTK帶希臘腳本 將NLTK與外國腳本一起使用 |
| 8.1 langdetect和langid庫 語言標識的有用庫 |
| 8.2 Word2Vec(Gensim) Google的Word2Vec |
HZ Sababa - HB20007 [email protected]
根據MIT許可分發。有關更多信息,請參見LICENSE 。