自然語言處理中的初學者資源列表
維護者
Dibya Chakravorty
貢獻
隨時發送拉動請求,或給我發送電子郵件([email protected])
這個列表如何開始
2016年11月10日,黑客新聞(HN)用戶Aarohmankad向HN社區詢問了有關初學者NLP資源的建議。此問HN線程變得很受歡迎,並在頭版停留了一段時間。在這段時間裡,它收集了有關初學者NLP資源的許多社區生成的建議。此列表試圖將討論匯總到一致的資源列表中。我還寫了一篇博客文章。
目錄
- 圖書
- MOOC
- YouTube視頻
- 在線大學課程
- 可以玩的包裝
- 學術論文
- 通過做學習
- 開源項目
- 有趣的想法
- 蜜蜂
- 用戶組
- 其他指南
圖書
- 語音和語言處理:NLP中的經典和標準教科書。第三版前出版草案可在此處提供。
- 使用Python的自然語言處理:面向應用程序的書。示例在Python(NLTK)中。在這裡免費的在線版本。
- 馴服文本:面向應用程序的書。例子在Java中。
- 統計自然語言處理的基礎:統計NLP上的經典文本。深入實施解析器,標籤者等。
- 自然語言處理手冊:NLP的完整處理,始於歷史根源,並以NLP的現代方法結束。
- 統計機器翻譯:學習如何製作像Google翻譯這樣的服務
- 信息檢索簡介:了解Google搜索和Google新聞(搜索,文本分類,聚類等)等服務的螺栓和螺栓
- 序言和自然語言分析:在Prolog中實施NLP Algortihms。
MOOC
- 密歇根大學提供的Coursera課程:入門課程涵蓋所有先決條件的材料。偏愛的編程語言是Python。
- Comlumbia University提供的Coursera課程,可在學術洪流上獲得:理論和概念課程。此時只有課程材料可用。
YouTube視頻
- Jurafsky和Martin的視頻系列:Jurafsky和Martin都是Stanford的教授,他們在NLP上寫了多本經典教科書。
- Stanford CS224D:NLP中的深度學習:NLP深度學習的應用
- NLP與Python和NLTK:使用Python和NLTK的面向應用程序的視頻系列。
在線大學課程
可以玩的包裝
- NLTK:Python中最受歡迎的NLP庫。書籍/免費在線版本的形式出色的文檔。強大而可擴展的。
- 斯坦福·科倫普(Stanford Corenlp):快速而有富裕的NLP圖書館,用Java撰寫。這裡有在線演示。
- Spacy:Python的另一個新興NLP庫。快速和狀態。在實施最新算法的同時,試圖保持統一的API。他們有一個博客和在線演示。
- Apache Tika:提供了一個統一的接口,用於從許多不同的文件格式(PPT,PDF等)和分析中提取文本數據和元數據。
學術論文
- NLP中的深度學習:一種GITHUB回購,收集了NLP深度學習論文。
通過做學習
通常,學習的最佳方法是為現有的開源NLP項目做出貢獻或實施有趣的想法。
開源項目
- 貝蒂:貝蒂(Betty)是一個開源項目,既有現實生活中的使用又是實用的NLP注意事項,並且正在尋找新的維護者。
有趣的想法
- 基於互動小說/解析器的小說:一個視頻遊戲,玩家的交互主要涉及文本。聽這個關於該主題的啟發性牙線播客。
蜜蜂
- IBM Watson Cloud:來自IBM Watson的製造商。它使您可以通過API在應用中集成NLP功能。有一個免費的層/免費試用。
用戶組
- AI中的ACM特殊興趣小組:如果您渴望面對人類接觸。
其他指南
- Quora關於如何進入NLP的問題
- GITHUB上的Awesome-NLP:一個包含策劃NLP資源列表的GitHub repo。