awd lstm tensorflow下载awd lstm tensorflow源代码下载

awd lstm tensorflow

Ai源码

1.0.0

下载

AWD-LSTM（重量Drop LSTM）具有训练量量化的量

来自（“正规化和优化LSTM语言模型”）的AWD-LSTM用于TensorFlow。

训练量量化的量化量化量化的量化量化的量化量化（“还提供了“有效整数仅推断的神经网络的量化和培训”）。

AWD-LSTM（重量下降LSTM）

环境

该代码已进行了tensorflow 1.11.0的实施和测试。和1.13.0。

用法

只需初始的AWD-LSTM，它就是标准的LayerRNNCell 。

 from weight_drop_lstm import WeightDropLSTMCell

lstm_cell = WeightDropLSTMCell(
    num_units=CELL_NUM, weight_drop_kr=WEIGHT_DP_KR, 
    use_vd=True, input_size=INPUT_SIZE)

参数定义如下：

num_units ：LSTM层中的单元格数。 [int]
weight_drop_kr ：快速权重的步骤数。 [int]
use_vd ：如果为true，则在重量下降连接上使用变分辍学，否则使用标准辍学。 [bool]
input_size ：如果use_vd=True ，则应提供input_size（上一个通道的维度）。 [int]

其余的关键字参数与tf.nn.LSTMCell完全相同。

指出，如果未提供或提供1.0的weiver_drop_kr，则WeightDropLSTMCell被减少为LSTMCell 。

将辍学内核的更新操作插入所需的位置。

 # By simply sess.run in each training step
sess.run(lstm_cell.get_vd_update_op())

# Or use control_dependencies
vd_update_ops = lstm_cell.get_vd_update_op() 
with tf.control_dependencies(vd_update_ops):
    tf.train.AdamOptimizer(learning_rate).minimize(loss)

您还可以在调用WeightDropLSTMCell时将get_vd_update_op()添加到GraphKeys.UPDATE_OPS 。

指出，如果您使用control_dependencies ，请小心执行顺序。
在优化器步骤之前，不应更新差异内核。

实施详细信息

AWD-LSTM的主要思想是连接的权重和限制输入。重量和置换输入的滴连锁连接

如果is_vd=True ，则将变量用于保存辍学内核。变异辍学的更新操作

实验结果

我已经对此实施进行了多对多递归任务进行实验，并且比简单的LSTMCell进行了更好的结果。

训练量量化

简而言之

 lstm_cell = WeightDropLSTMCell(
    num_units=CELL_NUM, weight_drop_kr=WEIGHT_DP_KR, 
    is_quant=True, is_train=True)
    
tf.contrib.quantize.create_training_graph(sess.graph, quant_delay=0)

详细说明将很快更新。

指出：某些量化问题将在`tf.while`中出现，而版本高于1.12.0。

成瘾：差异

我还提供了变异辍学的张量实现，它比TensorFlow中的DropoutWrapper更灵活。

用法类似于使用WeightDropLSTMCell ：

 from variational_dropout import VariationalDropout

vd = VariationalDropout(input_shape=[5], keep_prob=0.5)

# Directly sess.run() to update
sess.run(vd.get_update_mask_op())

# Or use control_dependencies
with tf.control_dependencies(vd.get_update_mask_op()):
    step, results_array = tf.while_loop(
        cond=lambda step, _: step < 5,
        body=main_loop,
        loop_vars=(step, results_array))
"""
    This is just a simple example. 
    Usually, control_dependencies will be placed where optimizer stepping.
"""

您还可以在调用VariationalDropout时将get_update_mask_op()添加到GraphKeys.UPDATE_OPS 。

再一次，如果您使用control_dependencies ，请小心执行顺序。

待办事项

提供本文提到的监管实用程序。
也许有一些更优雅的方法可以实现变分辍学。
拉出量化延迟。
提供非量化模型和量化模式的接口。
量化培训的文档。

如果您有任何建议，请告诉我。我会很感激！

联系与副本正确

jia-yau shiau [email protected]的代码工作。
量化代码工作建议并从彼得黄[email protected]分叉

展开

附加信息

版本 1.0.0
类型 Ai源码
更新时间 2025-09-09
大小 77.05KB
来自于 Github

awd lstm tensorflow

AWD-LSTM（重量Drop LSTM）具有训练量量化的量

AWD-LSTM（重量下降LSTM）

环境

用法

实施详细信息

实验结果

训练量量化

简而言之

详细说明将很快更新。

指出：某些量化问题将在`tf.while`中出现，而版本高于1.12.0。

成瘾：差异

待办事项

联系与副本正确

tensorflow

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express

awd lstm tensorflow

AWD-LSTM（重量Drop LSTM）具有训练量量化的量

AWD-LSTM（重量下降LSTM）

环境

用法

实施详细信息

实验结果

训练量量化

简而言之

详细说明将很快更新。

指出：某些量化问题将在tf.while中出现，而版本高于1.12.0。

成瘾：差异

待办事项

联系与副本正确

指出：某些量化问题将在`tf.while`中出现，而版本高于1.12.0。