生成没有缩放方差的张量的初始化程序。
用法
tf.compat.v1.uniform_unit_scaling_initializer(
factor=1.0, seed=None, dtype=tf.dtypes.float32
)
参数
-
factor
浮点数。一个乘法因子,值将被缩放。 -
seed
一个 Python 整数。用于创建随机种子。有关行为,请参见tf.compat.v1.set_random_seed
。 -
dtype
默认数据类型,如果在调用初始化程序时没有提供dtype
参数,则使用该类型。仅支持浮点类型。
在初始化深度网络时,原则上保持输入方差的规模不变是有利的,因此它不会在到达最后一层时爆炸或减小。如果输入是 x
和操作 x * W
,并且我们想随机初始化 W
,我们需要从中选择 W
[-sqrt(3) / sqrt(dim), sqrt(3) / sqrt(dim)]
保持比例不变,其中dim = W.shape[0]
(输入的大小)。卷积网络的类似计算给出了类似的结果,dim
等于前 3 个维度的乘积。当存在非线性时,我们需要将其乘以常数 factor
。请参阅 (Sussillo et al., 2014) 了解更深入的动机、实验和常数的计算。在第 2.3 节中,常数是用数值计算的:对于线性层,它是 1.0,relu:~1.43,tanh:~1.15。
参考:
Sussillo 等人,2014 年(pdf)
相关用法
- Python tf.compat.v1.uniform_unit_scaling_initializer.from_config用法及代码示例
- Python tf.compat.v1.distributions.Multinomial.stddev用法及代码示例
- Python tf.compat.v1.distribute.MirroredStrategy.experimental_distribute_dataset用法及代码示例
- Python tf.compat.v1.data.TFRecordDataset.interleave用法及代码示例
- Python tf.compat.v1.distributions.Bernoulli.cross_entropy用法及代码示例
- Python tf.compat.v1.Variable.eval用法及代码示例
- Python tf.compat.v1.train.FtrlOptimizer.compute_gradients用法及代码示例
- Python tf.compat.v1.layers.conv3d用法及代码示例
- Python tf.compat.v1.strings.length用法及代码示例
- Python tf.compat.v1.data.Dataset.snapshot用法及代码示例
- Python tf.compat.v1.data.experimental.SqlDataset.reduce用法及代码示例
- Python tf.compat.v1.feature_column.categorical_column_with_vocabulary_file用法及代码示例
- Python tf.compat.v1.data.TextLineDataset.from_tensors用法及代码示例
- Python tf.compat.v1.variable_scope用法及代码示例
- Python tf.compat.v1.data.experimental.SqlDataset.as_numpy_iterator用法及代码示例
- Python tf.compat.v1.distributions.Bernoulli.covariance用法及代码示例
- Python tf.compat.v1.placeholder用法及代码示例
- Python tf.compat.v1.layers.Conv3D用法及代码示例
- Python tf.compat.v1.train.get_or_create_global_step用法及代码示例
- Python tf.compat.v1.nn.static_rnn用法及代码示例
注:本文由纯净天空筛选整理自tensorflow.org大神的英文原创作品 tf.compat.v1.uniform_unit_scaling_initializer。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。