將嘈雜的線性餘弦衰減應用於學習率。
用法
tf.compat.v1.train.noisy_linear_cosine_decay(
learning_rate, global_step, decay_steps, initial_variance=1.0,
variance_decay=0.55, num_periods=0.5, alpha=0.0, beta=0.001, name=None
)
參數
-
learning_rate
標量float32
或float64
張量或 Python 數字。初始學習率。 -
global_step
標量int32
或int64
Tensor
或 Python 編號。用於衰減計算的全局步驟。 -
decay_steps
標量int32
或int64
Tensor
或 Python 編號。要衰減的步數。 -
initial_variance
噪聲的初始方差。見上麵的計算。 -
variance_decay
衰減噪聲的方差。見上麵的計算。 -
num_periods
衰減餘弦部分的周期數。見上麵的計算。 -
alpha
見上麵的計算。 -
beta
見上麵的計算。 -
name
String 。操作的可選名稱。默認為'NoisyLinearCosineDecay'。
返回
-
與
learning_rate
類型相同的標量Tensor
。衰減的學習率。
拋出
-
ValueError
如果未提供global_step
。
請注意,線性餘弦衰減比餘弦衰減更具侵略性,通常可以使用更大的初始學習率。
在訓練模型時,通常建議隨著訓練的進行降低學習率。此函數將噪聲線性餘弦衰減函數應用於提供的初始學習率。它需要一個global_step
值來計算衰減的學習率。您可以隻傳遞一個 TensorFlow 變量,該變量在每個訓練步驟中遞增。
該函數返回衰減的學習率。它被計算為:
global_step = min(global_step, decay_steps)
linear_decay = (decay_steps - global_step) / decay_steps)
cosine_decay = 0.5 * (
1 + cos(pi * 2 * num_periods * global_step / decay_steps))
decayed = (alpha + linear_decay + eps_t) * cosine_decay + beta
decayed_learning_rate = learning_rate * decayed
其中 eps_t 是具有方差的 0 中心高斯噪聲 initial_variance /(1 + global_step) ** variance_decay
示例用法:
decay_steps = 1000
lr_decayed = noisy_linear_cosine_decay(
learning_rate, global_step, decay_steps)
參考:
帶有強化學習的神經優化器搜索:Bello 等人,2017 (pdf) 帶有熱重啟的隨機梯度下降:Loshchilov 等人,2017 (pdf)
eager模式兼容性
當啟用即刻執行時,此函數返回一個函數,該函數又返回衰減的學習率張量。這對於在優化器函數的不同調用中更改學習率值很有用。
相關用法
- Python tf.compat.v1.train.natural_exp_decay用法及代碼示例
- Python tf.compat.v1.train.FtrlOptimizer.compute_gradients用法及代碼示例
- Python tf.compat.v1.train.get_or_create_global_step用法及代碼示例
- Python tf.compat.v1.train.cosine_decay_restarts用法及代碼示例
- Python tf.compat.v1.train.Optimizer用法及代碼示例
- Python tf.compat.v1.train.AdagradOptimizer.compute_gradients用法及代碼示例
- Python tf.compat.v1.train.init_from_checkpoint用法及代碼示例
- Python tf.compat.v1.train.Checkpoint用法及代碼示例
- Python tf.compat.v1.train.Supervisor.managed_session用法及代碼示例
- Python tf.compat.v1.train.Checkpoint.restore用法及代碼示例
- Python tf.compat.v1.train.global_step用法及代碼示例
- Python tf.compat.v1.train.MonitoredSession.run_step_fn用法及代碼示例
- Python tf.compat.v1.train.RMSPropOptimizer.compute_gradients用法及代碼示例
- Python tf.compat.v1.train.exponential_decay用法及代碼示例
- Python tf.compat.v1.train.MomentumOptimizer用法及代碼示例
- Python tf.compat.v1.train.RMSPropOptimizer用法及代碼示例
- Python tf.compat.v1.train.get_global_step用法及代碼示例
- Python tf.compat.v1.train.GradientDescentOptimizer.compute_gradients用法及代碼示例
- Python tf.compat.v1.train.linear_cosine_decay用法及代碼示例
- Python tf.compat.v1.train.Supervisor用法及代碼示例
注:本文由純淨天空篩選整理自tensorflow.org大神的英文原創作品 tf.compat.v1.train.noisy_linear_cosine_decay。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。