NLP的深度学习
本教程是在自然语言处理领域中使用深度学习算法的介绍。
它是使用以下来源的内容(理论和代码)制备的:
- 与Python的深度学习,FrançoisChollet的书
- 自然语言处理中的神经网络方法,Yoav Goldberg的书籍
- CS224D:自然语言处理的深度学习
关于Kaggle的有毒评论分类挑战数据集的练习代码
目录
用例
- 序列分类
- 语言检测
- 类别分类(情感,主题等)
- 关键字分类(名称性别,位置/人名称)
- 序列序列(SEQ2SEQ)
- 翻译
- Gmail智能回复
- 会话AI:聊天机器人
- 其他的
- 名称,故事,诗,对话框生成器
- 图像字幕
- 语音标签的一部分
- 名称实体识别
系统设置
- Python 3.6
- pip
- Virtualenv
- 图书馆:
播放数据集
- IMDB评论数据集
- Kaggle(有毒评论分类挑战)Wikipedia评论数据集
- Ubuntu对话COLPORA
- 翻译数据集
- 其他数据集
数据分析
- 一般分析
序列表示
- 表示
- 一个热编码
- 单词嵌入
型号
- 嵌入类模型1
- 嵌入连接到1层RNN(复发神经网络)模型2和模型2扩展的嵌入
- 双向RNN模型3和模型3扩展
现代RNN架构
- 长期记忆(LSTM)
- Gater复发单元(GRU)
- seq2seq
- 注意力
- 梁搜索
凯拉斯
- API和关键字
- 优化器
- 损失
- 激活
- 指标
- 将模型部署到生产和推理
模型优化技术
- 辍学
- 通过时间截断反向传播(TBPTT)
- 消失的梯度问题