
- 有關完整的數據科學任務,材料等。請檢查數據科學存儲庫。
- 對於機器學習算法,請檢查機器學習存儲庫。
- 有關深度學習算法,請檢查深度學習存儲庫。
- 有關計算機視覺,請檢查計算機視覺存儲庫。
具有特定任務/域的所有材料的文件夾
現代的NLP技術從復發的神經網絡和單詞嵌入到變形金剛和自我注意力。涵蓋了應用主題,例如回答和文本生成。
這是在Yandex數據分析學院(YSDA)教授的(ML)自然語言處理課程的擴展。目前,這裡可能只涵蓋部分主題。
本課程將涵蓋搜索引擎技術,這些技術在涉及文本數據的任何數據挖掘應用程序中都起著重要作用,原因有兩個。首先,儘管對於任何特定問題,原始數據可能很大,但它通常是相關數據的一個相對較小的子集,並且搜索引擎是快速在大型文本集合中快速發現相關文本數據的一小部分的必不可少的工具。其次,需要搜索引擎來幫助分析師通過允許它們檢查相關的原始文本數據以了解任何發現的模式來解釋數據中發現的任何模式。您將學習文本檢索中的基本概念,原理和主要技術,即搜索引擎的基礎科學。
O'Reilly Media的“實用自然語言處理”的官方存儲庫
可作為書籍提供:python中的NLP- Quickstart Guide
| 標題 | 描述 |
|---|---|
| ACL | 在Vimeo |
| [Stanford CS224N:深度學習的自然語言處理 | 冬季2021](https://www.youtube.com/playlist?list=ploromvodv4rosh4v6133s9lfprhjembmj) |
| 自然語言處理(NLP)為零 | 通過TensorFlow |
| 零與英雄:NLP與Tensorflow和Keras(GDG Sofia Meetup) | |
| 自然語言處理 | 該內容基於機器學習大學(MLU)加速自然語言處理類別。幻燈片,筆記本和數據集可在GitHub上找到 |
我是Google的研究科學家。我博客有關自然語言處理和機器學習。
精心策劃的工程博客清單
梯度是一個組織,其任務是使任何人更容易了解AI並促進AI社區中的討論。我們是由斯坦福AI實驗室的一群學生和研究人員於2017年成立的。
| 標題 | 描述 |
|---|---|
| NVIDIA的深度學習示例 - 自然語言處理 | 深度學習的例子 |
| 使用變壓器的自然語言處理 | O'Reilly書的筆記本和材料“與變壓器的自然語言處理” |
| 很棒的NLP參考 | 精心策劃的資源清單,用於知識蒸餾,推薦系統,尤其是自然語言處理(NLP) |
| NLP-教程 | |
| 自然語言過程教程 | |
| NLP與Python | Scikit-Learn,NLTK,Spacy,Gensim,Textblob等... |
| NLP和數據科學GITHUB存儲庫聚光燈 | 一些被低估的NLP和數據科學GITHUB存儲庫的日常聚光燈。 |
| NLP 101:用於深度學習和自然語言處理的資源存儲庫 | 該文檔是為那些熱情地學習自然語言處理的人而起草的。如果有任何好的建議或建議,我將嘗試添加更多。 |
| NLP-Progress | 存儲庫跟踪自然語言處理的進度(NLP),包括數據集和最常見的NLP任務的當前最新設備。 |
| 擁抱臉 | HF博客文章的公共回購 |
| Allennlp | 開源NLP研究庫,建於Pytorch。 allenai.org |
NLP庫,框架,模塊
| 標題 | 描述 |
|---|---|
| 自然語言工具包(NLTK) | NLTK-自然語言工具包 - 是一套開源Python模塊,數據集和支持自然語言處理研究和開發的教程的套件。 |
| 天賦 |
最先進的自然語言處理(NLP)的非常簡單的框架。 Flair是: |
| 文字 | textacy是一個用於執行各種自然語言處理(NLP)任務的Python庫,該任務是建立在高性能Spacy庫上的。有了基本原理 - 詞組化,詞性標記,依賴性解析等----委派給另一個庫, textacy主要集中於以前的任務並遵循。 |
| Allennlp | NLP研究庫建立在Pytorch上,用於開發有關各種語言任務的最新深度學習模型。 |
| nlpgym | NLPGYM是彌合RL和NLP應用之間差距的工具包。這旨在促進DRL在自然語言處理任務上的研究和基準測試。該工具包為標準NLP任務(例如序列標籤,問答和序列分類)提供交互式環境。 |
| Gensim |
| 標題 | 描述 |
|---|---|
| NLP教程 | 深度學習研究人員的自然語言處理教程
|
| Python教程中的自然語言處理 | 使用自然語言處理比較站立喜劇演員 |
? 100條必須閱讀的NLP論文
?科學樞紐(論文)
?斯坦福大學NLP研討會時間表
? CS224N:深度學習的自然語言處理
? CIS 700-008-互動小說和文本生成
?哈佛NLP
?插圖的變壓器
實施了雙向注意力流神經網絡作為小隊的基準,改善了克里斯·喬特(Chris Chute)的模型實現,添加了原始論文中所述的單詞字符輸入並改善了Gauthierdmns的代碼。