当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python tf.estimator.experimental.RNNClassifier用法及代码示例


TensorFlow RNN 模型的分类器。

警告:不建议将估算器用于新代码。估算器运行tf.compat.v1.Session-style 代码更难正确编写,并且可能出现意外行为,尤其是与 TF 2 代码结合使用时。估算器确实属于我们的兼容性保证,但不会收到除安全漏洞以外的任何修复。见迁移指南详情。

继承自:RNNEstimatorEstimator

用法

tf.estimator.experimental.RNNClassifier(
    sequence_feature_columns, context_feature_columns=None, units=None,
    cell_type=USE_DEFAULT, rnn_cell_fn=None, return_sequences=False, model_dir=None,
    n_classes=2, weight_column=None, label_vocabulary=None,
    optimizer='Adagrad',
    loss_reduction=tf.losses.Reduction.SUM_OVER_BATCH_SIZE,
    sequence_mask='sequence_mask', config=None
)

参数

  • sequence_feature_columns 包含表示顺序输入的 FeatureColumn 的可迭代对象。集合中的所有项目都应该是序列列(例如 sequence_numeric_column )或从一个列构造(例如 embedding_columnsequence_categorical_column_* 作为输入)。
  • context_feature_columns 包含用于上下文输入的 FeatureColumn 的迭代。这些列表示的数据将在每个时间步被复制并提供给 RNN。这些列必须是派生自 DenseColumn 的类的实例,例如 numeric_column ,而不是顺序变体。
  • units 每个 RNN 层的整数个隐藏单元的迭代。如果设置,还必须指定 cell_type 并且 rnn_cell_fn 必须是 None
  • cell_type 生成 RNN 单元的类或指定单元类型的字符串。支持的字符串是:'simple_rnn' , 'lstm''gru'。如果设置,还必须指定 units 并且 rnn_cell_fn 必须是 None
  • rnn_cell_fn 一个返回 RNN 单元实例的函数,该实例将用于构造 RNN。如果设置,则无法设置unitscell_type。这适用于需要在 unitscell_type 之外进行额外自定义的高级用户。请注意,堆叠 RNN 需要 tf.keras.layers.StackedRNNCells
  • return_sequences 一个布尔值,指示是返回输出序列中的最后一个输出,还是返回完整序列。请注意,如果为 True,weight_column 必须为 None 或字符串。
  • model_dir 保存模型参数、图形等的目录。这也可用于将检查点从目录加载到估计器中,以继续训练先前保存的模型。
  • n_classes 标签类别的数量。默认为2,即二分类。必须 > 1。
  • weight_column tf.feature_column.numeric_column 创建的字符串或 NumericColumn 定义表示权重的特征列。它用于在训练期间减轻重量或增加示例。它将乘以示例的损失。如果它是一个字符串,它被用作从 features 中获取权重张量的键。如果是 NumericColumn ,则通过键 weight_column.key 获取原始张量,然后对其应用 weight_column.normalizer_fn 以获得权​​重张量。
  • label_vocabulary 字符串列表表示可能的标签值。如果给定,标签必须是字符串类型并且在 label_vocabulary 中具有任何值。如果没有给出,这意味着标签已经编码为整数或在 [0, 1] 内为 n_classes=2 和在 {0, 1,..., n_classes-1} 中编码为整数值 n_classes > 2.如果没有提供词汇并且标签是字符串,也会出现错误。
  • optimizer tf.Optimizer 的实例或指定优化器类型的字符串。默认为 Adagrad 优化器。
  • loss_reduction tf.losses.Reduction 之一,除了 NONE 。说明如何减少批量训练损失。默认为 SUM_OVER_BATCH_SIZE
  • sequence_mask 具有序列掩码张量名称的字符串。如果sequence_mask 在特征字典中,则使用提供的张量,否则从序列特征的长度计算序列掩码。序列掩码用于评估和训练模式以汇总损失和度量计算,同时排除填充步骤。它还在预测模式下添加到预测字典中,以指示哪些步骤正在填充。
  • config RunConfig 对象来配置运行时设置。

抛出

  • ValueError 如果 units , cell_typernn_cell_fn 不兼容。

属性

  • config
  • model_dir
  • model_fn 返回绑定到 self.paramsmodel_fn
  • params

训练循环神经网络模型以将实例分类为多个类之一。

例子:

token_sequence = sequence_categorical_column_with_hash_bucket(...)
token_emb = embedding_column(categorical_column=token_sequence, ...)

estimator = RNNClassifier(
    sequence_feature_columns=[token_emb],
    units=[32, 16], cell_type='lstm')

# Input builders
def input_fn_train:# returns x, y
  pass
estimator.train(input_fn=input_fn_train, steps=100)

def input_fn_eval:# returns x, y
  pass
metrics = estimator.evaluate(input_fn=input_fn_eval, steps=10)
def input_fn_predict:# returns x, None
  pass
predictions = estimator.predict(input_fn=input_fn_predict)

trainevaluate 的输入应具有以下特征,否则会出现 KeyError

  • 如果 weight_column 不是 None ,则具有 key=weight_column 的特征,其值为 Tensor
  • 对于每个columnsequence_feature_columns
    • 具有 key=column.name 的函数,其 valueSparseTensor
  • 对于每个columncontext_feature_columns
    • 如果 columnCategoricalColumn ,则具有 key=column.name 的特征,其 valueSparseTensor
    • 如果 columnWeightedCategoricalColumn ,则有两个特征:第一个具有 key id 列名,第二个具有 key 权重列名。两个函数的 value 必须是 SparseTensor
    • 如果 columnDenseColumn ,则具有 key=column.name 的特征,其 valueTensor

损失是通过使用 softmax 交叉熵来计算的。

相关用法


注:本文由纯净天空筛选整理自tensorflow.org大神的英文原创作品 tf.estimator.experimental.RNNClassifier。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。