Python tf.keras.optimizers.schedules.ExponentialDecay用法及代码示例

使用 index 衰减时间表的 LearningRateSchedule。

继承自：LearningRateSchedule

用法

tf.keras.optimizers.schedules.ExponentialDecay(
    initial_learning_rate, decay_steps, decay_rate, staircase=False, name=None
)

一个 1-arg 可调用学习率计划，它采用当前优化器步骤并输出衰减的学习率，一个与 initial_learning_rate 类型相同的标量 Tensor 。

参数

initial_learning_rate 标量 float32 或 float64 Tensor 或 Python 编号。初始学习率。
decay_steps 标量 int32 或 int64 Tensor 或 Python 编号。必须是积极的。请参阅上面的衰减计算。
decay_rate 标量 float32 或 float64 Tensor 或 Python 编号。衰减率。
staircase 布尔值。如果True 以离散间隔衰减学习率
name String 。操作的可选名称。默认为'ExponentialDecay'。

在训练模型时，随着训练的进行降低学习率通常很有用。给定提供的初始学习率，此计划将 index 衰减函数应用于优化器步骤。

该计划是一个 1-arg 可调用对象，当通过当前优化器步骤时会产生衰减的学习率。这对于在优化器函数的不同调用中更改学习率值很有用。它被计算为：

def decayed_learning_rate(step):
  return initial_learning_rate * decay_rate ^ (step / decay_steps)

如果参数 staircase 是 True ，则 step / decay_steps 是整数除法，衰减的学习率遵循阶梯函数。

您可以将此计划直接传递到 tf.keras.optimizers.Optimizer 作为学习率。示例：拟合 Keras 模型时，每 100000 步衰减一次，底数为 0.96：

initial_learning_rate = 0.1
lr_schedule = tf.keras.optimizers.schedules.ExponentialDecay(
    initial_learning_rate,
    decay_steps=100000,
    decay_rate=0.96,
    staircase=True)

model.compile(optimizer=tf.keras.optimizers.SGD(learning_rate=lr_schedule),
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(data, labels, epochs=5)

学习率计划也可以使用 tf.keras.optimizers.schedules.serialize 和 tf.keras.optimizers.schedules.deserialize 进行序列化和反序列化。

相关用法

注：本文由纯净天空筛选整理自tensorflow.org大神的英文原创作品 tf.keras.optimizers.schedules.ExponentialDecay。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法

返回

参数