用法:
mxnet.symbol.sparse.sgd_mom_update(weight=None, grad=None, mom=None, lr=_Null, momentum=_Null, wd=_Null, rescale_grad=_Null, clip_gradient=_Null, lazy_update=_Null, name=None, attr=None, out=None, **kwargs)
- weight:(
Symbol
) - 重量 - grad:(
Symbol
) - 坡度 - mom:(
Symbol
) - 勢頭 - lr:(
float
,
required
) - 學習率 - momentum:(
float
,
optional
,
default=0
) - 每個時期動量估計的衰減率。 - wd:(
float
,
optional
,
default=0
) - 權重衰減通過懲罰大權重的正則化項來增強目標函數。懲罰與每個權重大小的平方成比例。 - rescale_grad:(
float
,
optional
,
default=1
) - 將漸變重新縮放為 grad = rescale_grad*grad。 - clip_gradient:(
float
,
optional
,
default=-1
) - 將漸變剪裁到 [-clip_gradient, clip_gradient] 的範圍內 如果clip_gradient <= 0,漸變剪裁被關閉。畢業 = 最大(最小(畢業,clip_gradient),-clip_gradient)。 - lazy_update:(
boolean
,
optional
,
default=1
) - 如果為 true,如果梯度的 stype 為 row_sparse 並且權重和動量具有相同的 stype,則應用延遲更新 - name:(
string
,
optional.
) - 結果符號的名稱。
- weight:(
結果符號。
參數:
返回:
返回類型:
隨機梯度下降 (SGD) 優化器的動量更新函數。
動量更新在神經網絡上具有更好的收斂速度。從數學上看,它如下所示:
它使用以下方法更新權重:
v = momentum * v - learning_rate * gradient weight += v
其中參數
momentum
是每個時期動量估計的衰減率。但是,如果 grad 的存儲類型為
row_sparse
,lazy_update
為 True 且權重的存儲類型與動量的存儲類型相同,則僅更新索引出現在 grad.indices 中的行切片(權重和動量):for row in gradient.indices: v[row] = momentum[row] * v[row] - learning_rate * gradient[row] weight[row] += v[row]
相關用法
- Python mxnet.symbol.sparse.sgd_update用法及代碼示例
- Python mxnet.symbol.sparse.sum用法及代碼示例
- Python mxnet.symbol.sparse.sign用法及代碼示例
- Python mxnet.symbol.sparse.square用法及代碼示例
- Python mxnet.symbol.sparse.stop_gradient用法及代碼示例
- Python mxnet.symbol.sparse.sqrt用法及代碼示例
- Python mxnet.symbol.sparse.exp用法及代碼示例
- Python mxnet.symbol.sparse.zeros_like用法及代碼示例
- Python mxnet.symbol.sparse.cbrt用法及代碼示例
- Python mxnet.symbol.sparse.make_loss用法及代碼示例
- Python mxnet.symbol.sparse.broadcast_mul用法及代碼示例
- Python mxnet.symbol.sparse.ftrl_update用法及代碼示例
- Python mxnet.symbol.sparse.concat用法及代碼示例
- Python mxnet.symbol.sparse.broadcast_sub用法及代碼示例
- Python mxnet.symbol.sparse.abs用法及代碼示例
- Python mxnet.symbol.sparse.fix用法及代碼示例
- Python mxnet.symbol.sparse.broadcast_div用法及代碼示例
- Python mxnet.symbol.sparse.floor用法及代碼示例
- Python mxnet.symbol.sparse.norm用法及代碼示例
- Python mxnet.symbol.sparse.broadcast_add用法及代碼示例
- Python mxnet.symbol.sparse.ceil用法及代碼示例
- Python mxnet.symbol.sparse.adam_update用法及代碼示例
- Python mxnet.symbol.sparse.broadcast_plus用法及代碼示例
- Python mxnet.symbol.sparse.broadcast_minus用法及代碼示例
- Python mxnet.symbol.sparse.trunc用法及代碼示例
注:本文由純淨天空篩選整理自apache.org大神的英文原創作品 mxnet.symbol.sparse.sgd_mom_update。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。