当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python tf.compat.v1.distributions.StudentT用法及代码示例


学生的 t 分布。

继承自:Distribution

用法

tf.compat.v1.distributions.StudentT(
    df, loc, scale, validate_args=False, allow_nan_stats=True,
    name='StudentT'
)

参数

  • df 浮点 Tensor 。分布的自由度。 df 必须只包含正值。
  • loc 浮点 Tensor 。分布的平均值。
  • scale 浮点 Tensor 。分布的比例因子。请注意,scale 在技术上不是此分布的标准差,但其语义更类似于标准差而不是方差。
  • validate_args Python bool ,默认 False 。尽管可能会降低运行时性能,但检查 True 分发参数的有效性时。当False 无效输入可能会默默呈现不正确的输出。
  • allow_nan_stats Python bool ,默认 True 。当 True 时,统计信息(例如,均值、众数、方差)使用值“NaN”来指示结果未定义。当 False 时,如果一个或多个统计数据的批处理成员未定义,则会引发异常。
  • name Python str 名称以此类创建的 Ops 为前缀。

抛出

  • TypeError 如果 loc 和 scale 是不同的数据类型。

属性

  • allow_nan_stats Pythonbool说明未定义统计信息时的行为。

    统计数据在有意义时返回 +/- 无穷大。例如,柯西分布的方差是无穷大的。但是,有时统计数据是未定义的,例如,如果分布的 pdf 在分布的支持范围内没有达到最大值,则模式是未定义的。如果均值未定义,则根据定义,方差未定义。例如: df = 1 的 Student's T 的平均值是未定义的(没有明确的方式说它是 + 或 - 无穷大),因此方差 = E[(X - mean)**2] 也是未定义的。

  • batch_shape 来自单个事件索引的单个样本的形状作为TensorShape.

    可能部分定义或未知。

    批次维度是该分布的独立、不同参数化的索引。

  • df 这些学生 t 分布的自由度。
  • dtype TensorDType 由此 Distribution 处理。
  • event_shape 单个批次的单个样品的形状作为TensorShape.

    可能部分定义或未知。

  • loc 这些学生 t 分布的位置。
  • name Distribution 创建的所有操作前的名称。
  • parameters 用于实例化此 Distribution 的参数字典。
  • reparameterization_type 说明如何重新参数化分布中的样本。

    目前这是静态实例 distributions.FULLY_REPARAMETERIZEDdistributions.NOT_REPARAMETERIZED 之一。

  • scale 这些学生 t 分布的比例因子。
  • validate_args Python bool 表示启用了可能昂贵的检查。

此分布具有参数:自由度 df 、位置 locscale

数学细节

概率密度函数 (pdf) 是,

pdf(x; df, mu, sigma) = (1 + y**2 / df)**(-0.5 (df + 1)) / Z
where,
y = (x - mu) / sigma
Z = abs(sigma) sqrt(df pi) Gamma(0.5 df) / Gamma(0.5 (df + 1))

其中:

  • loc = mu ,
  • scale = sigma ,并且,
  • Z 是归一化常数,并且,
  • Gamma 是伽玛​​函数。

StudentT 分布是location-scale 系列的成员,即它可以构造为,

X ~ StudentT(df, loc=0, scale=1)
Y = loc + scale * X

请注意,scale 的语义更类似于标准差而不是方差。然而,它实际上不是标准。偏差;学生的 t 分布标准。开发。是 scale sqrt(df / (df - 2))df > 2

该分布的样本被重新参数化(路径可微)。导数是使用 (Figurnov et al., 2018) 中说明的方法计算的。

例子

一个或一批分布的初始化示例。

import tensorflow_probability as tfp
tfd = tfp.distributions

# Define a single scalar Student t distribution.
single_dist = tfd.StudentT(df=3)

# Evaluate the pdf at 1, returning a scalar Tensor.
single_dist.prob(1.)

# Define a batch of two scalar valued Student t's.
# The first has degrees of freedom 2, mean 1, and scale 11.
# The second 3, 2 and 22.
multi_dist = tfd.StudentT(df=[2, 3], loc=[1, 2.], scale=[11, 22.])

# Evaluate the pdf of the first distribution on 0, and the second on 1.5,
# returning a length two tensor.
multi_dist.prob([0, 1.5])

# Get 3 samples, returning a 3 x 2 tensor.
multi_dist.sample(3)

尽可能广播参数。

# Define a batch of two Student's t distributions.
# Both have df 2 and mean 1, but different scales.
dist = tfd.StudentT(df=2, loc=1, scale=[11, 22.])

# Evaluate the pdf of both distributions on the same point, 3.0,
# returning a length 2 tensor.
dist.prob(3.0)

计算样本的梯度 w.r.t.参数:

df = tf.constant(2.0)
loc = tf.constant(2.0)
scale = tf.constant(11.0)
dist = tfd.StudentT(df=df, loc=loc, scale=scale)
samples = dist.sample(5)  # Shape [5]
loss = tf.reduce_mean(tf.square(samples))  # Arbitrary loss function
# Unbiased stochastic gradients of the loss function
grads = tf.gradients(loss, [df, loc, scale])

参考:

隐式重新参数化梯度:Figurnov 等人,2018 (pdf)

相关用法


注:本文由纯净天空筛选整理自tensorflow.org大神的英文原创作品 tf.compat.v1.distributions.StudentT。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。