nlp_fundamentals
1.0.0
(正在進行中工作!)
自然語言處理(NLP)在過去幾年中取得了重大進步,這是由於基於深度學習的現代技術的成功。隨著NLP的受歡迎程度的興起以及不同形式的大規模數據的可用性,從第一原則中了解NLP技術和概念的內部運作是更加必要的,因為它們從第一原則中找到了他們進入實際影響社會的現實世界使用和應用程序。建立直覺和對概念的牢固掌握對於提出創新技術,改進研究以及建立安全,以人為以人為本的AI和NLP技術都很重要。
我們介紹了一個名為NLP基礎知識的新系列,我們旨在教授重要的NLP技術和概念,從第一原則開始。我們將介紹整個系列涵蓋的每個概念的理論方面和動機。然後,我們將通過使用Bootstrap方法,行業標準工具和其他開源庫來獲得實踐經驗,以實施不同的技術。在此過程中,我們還將涵蓋最佳實踐,分享重要的參考,指出訓練和構建NLP模型時要避免的常見錯誤,並討論未來的情況。
加入我們的Slack社區,找到更多有關此項目和其他正在進行的項目的更多信息。隨時在Twitter上與我接觸,以邀請我們的Slack小組。
第1章:象徵化,lemmatization,stemming和句子細分 - COLAB筆記本,網絡版本
nlp_fundamentals標籤。 good first issue標籤的問題是入門的好任務。