循环神经网络
含隐藏状态的循环神经网络
1 | from mxnet import nd |
1 | [[ 3.1951556 -7.028843 6.2385654 3.5568767 ] |
语言模型数据集(周杰伦专辑歌词)
1 | from mxnet import nd |
1 | 想要有直升机 |
采样类型 | 说明 |
---|---|
随机采样 | 相邻两次迭代采样序列不相邻!随机!循环神经网络隐藏状态需要每次初始化 |
相邻采样 | 相邻两次迭代采样序列相邻!循环神经网络隐藏状态只需要第一次初始化 |
随机采样
1 | from mxnet import nd |
1 | X: |
相邻采样
1 | from mxnet import nd |
1 | [[ 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14.] |
循环神经网络从零开始实现
one_hot向量
1 | from mxnet import nd |
1 | [[0. 1. 2. 3. 4.] |
模型训练以及预测
1 | from mxnet import nd |
测试
1 | will use cpu(0) |
1 | from mxnet import nd |
随机采样训练
1 | epoch 50, perplexity 72.632877, time 3.05 sec |
相邻采样训练
1 | epoch 50, perplexity 63.569066, time 3.13 sec |
循环神经网络的简洁实现
测试
1 | import math |
1 | (1, 2, 256) |
训练
1 | import math |
门控循环神经网络GRU
从零开始实现
1 | from mxnet import nd, autograd |
1 | epoch 40, perplexity 152.503488, time 3.45 sec |
简洁实现
1 | import math |
1 | 想要有直升机 |
长短期记忆循环神经网络LSTM
LSTM原生实现
1 | from mxnet import nd, autograd |
LSTM简洁实现
1 | import math |
深度循环神经网络DRNN
DRNN原生实现
1 | from mxnet import nd |
DRNN简洁实现
1 | import math |