NLP的深度學習
本教程是在自然語言處理領域中使用深度學習算法的介紹。
它是使用以下來源的內容(理論和代碼)製備的:
- 與Python的深度學習,FrançoisChollet的書
- 自然語言處理中的神經網絡方法,Yoav Goldberg的書籍
- CS224D:自然語言處理的深度學習
關於Kaggle的有毒評論分類挑戰數據集的練習代碼
目錄
用例
- 序列分類
- 語言檢測
- 類別分類(情感,主題等)
- 關鍵字分類(名稱性別,位置/人名稱)
- 序列序列(SEQ2SEQ)
- 翻譯
- Gmail智能回复
- 會話AI:聊天機器人
- 其他的
- 名稱,故事,詩,對話框生成器
- 圖像字幕
- 語音標籤的一部分
- 名稱實體識別
系統設置
- Python 3.6
- pip
- Virtualenv
- 圖書館:
播放數據集
- IMDB評論數據集
- Kaggle(有毒評論分類挑戰)Wikipedia評論數據集
- Ubuntu對話COLPORA
- 翻譯數據集
- 其他數據集
數據分析
- 一般分析
序列表示
- 表示
- 一個熱編碼
- 單詞嵌入
型號
- 嵌入類模型1
- 嵌入連接到1層RNN(復發神經網絡)模型2和模型2擴展的嵌入
- 雙向RNN模型3和模型3擴展
現代RNN架構
- 長期記憶(LSTM)
- Gater復發單元(GRU)
- seq2seq
- 注意力
- 梁搜索
凱拉斯
- API和關鍵字
- 優化器
- 損失
- 啟用設定
- 指標
- 將模型部署到生產和推理
模型優化技術
- 輟學
- 通過時間截斷反向傳播(TBPTT)
- 消失的梯度問題