当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python tf.estimator.MultiLabelHead用法及代码示例


为多标签分类创建Head

继承自:Head

用法

tf.estimator.MultiLabelHead(
    n_classes, weight_column=None, thresholds=None, label_vocabulary=None,
    loss_reduction=tf.losses.Reduction.SUM_OVER_BATCH_SIZE, loss_fn=None,
    classes_for_class_based_metrics=None, name=None
)

参数

  • n_classes 类数,必须大于 1(对于 1 个类,使用 BinaryClassHead )。
  • weight_column tf.feature_column.numeric_column 创建的字符串或 NumericColumn 定义表示权重的特征列。它用于在训练期间减轻重量或增加示例。它将乘以示例的损失。 Per-class 不支持加权。
  • thresholds (0, 1) 范围内的可迭代浮点数。针对每个阈值评估准确度、精确度和召回指标。阈值应用于预测概率,即高于阈值是 true ,低于阈值是 false
  • label_vocabulary 字符串列表表示可能的标签值。如果没有给出,这意味着标签已经被编码为 [0, n_classes) 或 multi-hot 张量内的整数。如果给定,标签必须是 SparseTensor string 类型并且在 label_vocabulary 中具有任何值。如果没有提供词汇并且标签是字符串,也会出现错误。
  • loss_reduction tf.losses.Reduction 之一,除了 NONE 。决定如何减少批量训练损失。默认为 SUM_OVER_BATCH_SIZE ,即损失的加权总和除以批量大小。
  • loss_fn 可选的损失函数。
  • classes_for_class_based_metrics 对其评估 per-class 指标的整数类 ID 或字符串类名称的列表。如果是整数,则都必须在 [0, n_classes - 1] 范围内。如果是字符串,则都必须在 label_vocabulary 中。
  • name 头名。如果提供,摘要和指标键将以 "/" + name 为后缀。创建操作时也用作name_scope

属性

  • logits_dimension 有关详细信息,请参阅base_head.Head
  • loss_reduction 有关详细信息,请参阅base_head.Head
  • name 有关详细信息,请参阅base_head.Head

多标签分类处理每个示例可能具有来自离散集合的零个或多个相关标签的情况。这与 MultiClassHead 不同,每个示例只有一个标签。

对类使用 sigmoid_cross_entropy 损失平均值,对批次使用加权和。也就是说,如果输入 logits 的形状为 [batch_size, n_classes] ,则损失是 n_classes 的平均值和 batch_size 的加权和。

头部期望 logits 形状为 [D0, D1, ... DN, n_classes] 。在许多应用程序中,形状是 [batch_size, n_classes]

标签可以是:

  • 形状为 [D0, D1, ... DN, n_classes] 的 multi-hot 张量
  • 类索引的整数SparseTensordense_shape 必须是 [D0, D1, ... DN, ?][0, n_classes) 中的值。
  • 如果给定 label_vocabulary,则为字符串 SparseTensordense_shape 必须是 [D0, D1, ... DN, ?]label_vocabulary 或形状为 [D0, D1, ... DN, n_classes] 的 multi-hot 张量内的值。

如果指定了 weight_column,则权重的形状必须为 [D0, D1, ... DN][D0, D1, ... DN, 1]

还支持自定义 loss_fnloss_fn(labels, logits)(labels, logits, features) 作为参数并返回形状为 [D0, D1, ... DN, 1] 的未减少损失。 loss_fn 必须支持形状为 [D0, D1, ... DN, n_classes] 的指标 labels。即,头部将 label_vocabulary 应用于输入标签,然后将它们传递给 loss_fn

用法:

n_classes = 2
head = tf.estimator.MultiLabelHead(n_classes)
logits = np.array([[-1., 1.], [-1.5, 1.5]], dtype=np.float32)
labels = np.array([[1, 0], [1, 1]], dtype=np.int64)
features = {'x':np.array([[41], [42]], dtype=np.int32)}
# expected_loss = sum(_sigmoid_cross_entropy(labels, logits)) / batch_size
#               = sum(1.31326169, 0.9514133) / 2 = 1.13
loss = head.loss(labels, logits, features=features)
print('{:.2f}'.format(loss.numpy()))
1.13
eval_metrics = head.metrics()
updated_metrics = head.update_metrics(
  eval_metrics, features, logits, labels)
for k in sorted(updated_metrics):
 print('{}:{:.2f}'.format(k, updated_metrics[k].result().numpy()))
auc:0.33
auc_precision_recall:0.77
average_loss:1.13
preds = head.predictions(logits)
print(preds['logits'])
tf.Tensor(
  [[-1.   1. ]
   [-1.5  1.5]], shape=(2, 2), dtype=float32)

与罐装估算器一起使用:

my_head = tf.estimator.MultiLabelHead(n_classes=3)
my_estimator = tf.estimator.DNNEstimator(
    head=my_head,
    hidden_units=...,
    feature_columns=...)

它也可以与自定义 model_fn 一起使用。例子:

def _my_model_fn(features, labels, mode):
  my_head = tf.estimator.MultiLabelHead(n_classes=3)
  logits = tf.keras.Model(...)(features)

  return my_head.create_estimator_spec(
      features=features,
      mode=mode,
      labels=labels,
      optimizer=tf.keras.optimizers.Adagrad(lr=0.1),
      logits=logits)

my_estimator = tf.estimator.Estimator(model_fn=_my_model_fn)

相关用法


注:本文由纯净天空筛选整理自tensorflow.org大神的英文原创作品 tf.estimator.MultiLabelHead。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。