生成沒有縮放方差的張量的初始化程序。
用法
tf.compat.v1.uniform_unit_scaling_initializer(
factor=1.0, seed=None, dtype=tf.dtypes.float32
)
參數
-
factor
浮點數。一個乘法因子,值將被縮放。 -
seed
一個 Python 整數。用於創建隨機種子。有關行為,請參見tf.compat.v1.set_random_seed
。 -
dtype
默認數據類型,如果在調用初始化程序時沒有提供dtype
參數,則使用該類型。僅支持浮點類型。
在初始化深度網絡時,原則上保持輸入方差的規模不變是有利的,因此它不會在到達最後一層時爆炸或減小。如果輸入是 x
和操作 x * W
,並且我們想隨機初始化 W
,我們需要從中選擇 W
[-sqrt(3) / sqrt(dim), sqrt(3) / sqrt(dim)]
保持比例不變,其中dim = W.shape[0]
(輸入的大小)。卷積網絡的類似計算給出了類似的結果,dim
等於前 3 個維度的乘積。當存在非線性時,我們需要將其乘以常數 factor
。請參閱 (Sussillo et al., 2014) 了解更深入的動機、實驗和常數的計算。在第 2.3 節中,常數是用數值計算的:對於線性層,它是 1.0,relu:~1.43,tanh:~1.15。
參考:
Sussillo 等人,2014 年(pdf)
相關用法
- Python tf.compat.v1.uniform_unit_scaling_initializer.from_config用法及代碼示例
- Python tf.compat.v1.distributions.Multinomial.stddev用法及代碼示例
- Python tf.compat.v1.distribute.MirroredStrategy.experimental_distribute_dataset用法及代碼示例
- Python tf.compat.v1.data.TFRecordDataset.interleave用法及代碼示例
- Python tf.compat.v1.distributions.Bernoulli.cross_entropy用法及代碼示例
- Python tf.compat.v1.Variable.eval用法及代碼示例
- Python tf.compat.v1.train.FtrlOptimizer.compute_gradients用法及代碼示例
- Python tf.compat.v1.layers.conv3d用法及代碼示例
- Python tf.compat.v1.strings.length用法及代碼示例
- Python tf.compat.v1.data.Dataset.snapshot用法及代碼示例
- Python tf.compat.v1.data.experimental.SqlDataset.reduce用法及代碼示例
- Python tf.compat.v1.feature_column.categorical_column_with_vocabulary_file用法及代碼示例
- Python tf.compat.v1.data.TextLineDataset.from_tensors用法及代碼示例
- Python tf.compat.v1.variable_scope用法及代碼示例
- Python tf.compat.v1.data.experimental.SqlDataset.as_numpy_iterator用法及代碼示例
- Python tf.compat.v1.distributions.Bernoulli.covariance用法及代碼示例
- Python tf.compat.v1.placeholder用法及代碼示例
- Python tf.compat.v1.layers.Conv3D用法及代碼示例
- Python tf.compat.v1.train.get_or_create_global_step用法及代碼示例
- Python tf.compat.v1.nn.static_rnn用法及代碼示例
注:本文由純淨天空篩選整理自tensorflow.org大神的英文原創作品 tf.compat.v1.uniform_unit_scaling_initializer。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。