用法:
class mxnet.optimizer.Signum(learning_rate=0.01, momentum=0.9, wd_lh=0.0, **kwargs)- momentum:(
float,optional) - 动量值。 - wd_lh:(
float,optional) - 解耦权重衰减正则化的量,详见原论文:https://arxiv.org/abs/1711.05101
- momentum:(
参数:
基础:
mxnet.optimizer.optimizer.Optimizer采用梯度或动量符号的 Signum 优化器。
优化器通过以下方式更新权重:
rescaled_grad = rescale_grad * clip(grad, clip_gradient) + wd * weight state = momentum * state + (1-momentum)*rescaled_grad weight = (1 - lr * wd_lh) * weight - lr * sign(state)参考:
Jeremy Bernstein、Yu-Xiang Wang、Kamyar Azizzadenesheli 和 Anima Anandkumar。 (2018 年)。 signSGD:非凸问题的压缩优化。在 ICML'18 中。
见:https://arxiv.org/abs/1802.04434
有关更新算法的详细信息,请参阅
和signsgd_update。signum_update除了
接受的参数之外,此优化器还接受以下参数。Optimizer
相关用法
- Python mxnet.optimizer.SGD用法及代码示例
- Python mxnet.optimizer.AdaDelta用法及代码示例
- Python mxnet.optimizer.Ftrl用法及代码示例
- Python mxnet.optimizer.AdaGrad用法及代码示例
- Python mxnet.optimizer.Adam用法及代码示例
- Python mxnet.optimizer.register用法及代码示例
- Python mxnet.optimizer.FTML用法及代码示例
- Python mxnet.optimizer.Adamax用法及代码示例
- Python mxnet.optimizer.Optimizer.create_optimizer用法及代码示例
- Python mxnet.optimizer.Optimizer.register用法及代码示例
- Python mxnet.optimizer.create用法及代码示例
- Python mxnet.symbol.op.broadcast_logical_xor用法及代码示例
- Python mxnet.test_utils.get_zip_data用法及代码示例
- Python mxnet.ndarray.op.uniform用法及代码示例
- Python mxnet.symbol.op.log_softmax用法及代码示例
- Python mxnet.symbol.space_to_depth用法及代码示例
- Python mxnet.ndarray.op.sample_negative_binomial用法及代码示例
- Python mxnet.ndarray.NDArray.ndim用法及代码示例
- Python mxnet.module.BaseModule.get_outputs用法及代码示例
- Python mxnet.module.BaseModule.forward用法及代码示例
注:本文由纯净天空筛选整理自apache.org大神的英文原创作品 mxnet.optimizer.Signum。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。
