当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python tf.nn.weighted_cross_entropy_with_logits用法及代码示例


计算加权交叉熵。

用法

tf.nn.weighted_cross_entropy_with_logits(
    labels, logits, pos_weight, name=None
)

参数

  • labels logits 具有相同类型和形状的 Tensor ,其值介于 0 和 1(含)之间。
  • logits Tensor 类型为 float32float64 ,任何实数。
  • pos_weight 用于正样本的系数,通常是标量,但可以广播到 logits 的形状。它的值应该是非负的。
  • name 操作的名称(可选)。

返回

  • logits 形状相同的 Tensor,具有分量加权逻辑损失。

抛出

  • ValueError 如果logitslabels 的形状不同。

这就像 sigmoid_cross_entropy_with_logits() 除了 pos_weight 允许人们通过向上或 down-weighting 相对于负错误的正错误成本来权衡召回和精度。

通常的cross-entropy 成本定义为:

labels * -log(sigmoid(logits)) +
    (1 - labels) * -log(1 - sigmoid(logits))

pos_weight > 1 会减少假阴性计数,从而增加召回率。相反,设置 pos_weight < 1 会减少误报计数并提高精度。这可以从 pos_weight 被引入作为损失表达式中正标签项的乘法系数的事实中看出:

labels * -log(sigmoid(logits)) * pos_weight +
    (1 - labels) * -log(1 - sigmoid(logits))

为简洁起见,让 x = logits , z = labels , q = pos_weight 。损失是:

qz * -log(sigmoid(x)) + (1 - z) * -log(1 - sigmoid(x))
= qz * -log(1 / (1 + exp(-x))) + (1 - z) * -log(exp(-x) / (1 + exp(-x)))
= qz * log(1 + exp(-x)) + (1 - z) * (-log(exp(-x)) + log(1 + exp(-x)))
= qz * log(1 + exp(-x)) + (1 - z) * (x + log(1 + exp(-x))
= (1 - z) * x + (qz +  1 - z) * log(1 + exp(-x))
= (1 - z) * x + (1 + (q - 1) * z) * log(1 + exp(-x))

设置 l = (1 + (q - 1) * z) ,为了保证稳定性和避免溢出,实现使用

(1 - z) * x + l * (log(1 + exp(-abs(x))) + max(-x, 0))

logitslabels 必须具有相同的类型和形状。

labels = tf.constant([1., 0.5, 0.])
logits = tf.constant([1.5, -0.1, -10.])
tf.nn.weighted_cross_entropy_with_logits(
    labels=labels, logits=logits, pos_weight=tf.constant(1.5)).numpy()
array([3.0211994e-01, 8.8049585e-01, 4.5776367e-05], dtype=float32)
tf.nn.weighted_cross_entropy_with_logits(
    labels=labels, logits=logits, pos_weight=tf.constant(0.5)).numpy()
array([1.00706644e-01, 5.08297503e-01, 4.57763672e-05], dtype=float32)

相关用法


注:本文由纯净天空筛选整理自tensorflow.org大神的英文原创作品 tf.nn.weighted_cross_entropy_with_logits。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。