CharLM
1.0.0
这是Yoon Kim本文提出的角色感知神经语言模型的Pytorch实施。
该代码使用Python 3.5.2和Pytorch 0.3.1进行运行和测试。
| Hyperparam | 价值 |
|---|---|
| LSTM批处理大小 | 20 |
| LSTM序列长度 | 35 |
| LSTM隐藏单元 | 300 |
| 时代 | 35 |
| 初始学习率 | 1.0 |
| 字符嵌入维度 | 15 |
使用分列/有效/测试数据训练模型。
python train.py
训练有素的模型将保存在cache/net.pkl中。测试模型。
python test.py
测试集的最佳结果:PPL = 127.2163横熵损失= 4.8459
该实施从中借来的想法
https://github.com/jarfo/kchar
https://github.com/cronos123/character-aware-aur-naturage-models