當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python tf.estimator.experimental.RNNClassifier用法及代碼示例


TensorFlow RNN 模型的分類器。

警告:不建議將估算器用於新代碼。估算器運行tf.compat.v1.Session-style 代碼更難正確編寫,並且可能出現意外行為,尤其是與 TF 2 代碼結合使用時。估算器確實屬於我們的兼容性保證,但不會收到除安全漏洞以外的任何修複。見遷移指南詳情。

繼承自:RNNEstimatorEstimator

用法

tf.estimator.experimental.RNNClassifier(
    sequence_feature_columns, context_feature_columns=None, units=None,
    cell_type=USE_DEFAULT, rnn_cell_fn=None, return_sequences=False, model_dir=None,
    n_classes=2, weight_column=None, label_vocabulary=None,
    optimizer='Adagrad',
    loss_reduction=tf.losses.Reduction.SUM_OVER_BATCH_SIZE,
    sequence_mask='sequence_mask', config=None
)

參數

  • sequence_feature_columns 包含表示順序輸入的 FeatureColumn 的可迭代對象。集合中的所有項目都應該是序列列(例如 sequence_numeric_column )或從一個列構造(例如 embedding_columnsequence_categorical_column_* 作為輸入)。
  • context_feature_columns 包含用於上下文輸入的 FeatureColumn 的迭代。這些列表示的數據將在每個時間步被複製並提供給 RNN。這些列必須是派生自 DenseColumn 的類的實例,例如 numeric_column ,而不是順序變體。
  • units 每個 RNN 層的整數個隱藏單元的迭代。如果設置,還必須指定 cell_type 並且 rnn_cell_fn 必須是 None
  • cell_type 生成 RNN 單元的類或指定單元類型的字符串。支持的字符串是:'simple_rnn' , 'lstm''gru'。如果設置,還必須指定 units 並且 rnn_cell_fn 必須是 None
  • rnn_cell_fn 一個返回 RNN 單元實例的函數,該實例將用於構造 RNN。如果設置,則無法設置unitscell_type。這適用於需要在 unitscell_type 之外進行額外自定義的高級用戶。請注意,堆疊 RNN 需要 tf.keras.layers.StackedRNNCells
  • return_sequences 一個布爾值,指示是返回輸出序列中的最後一個輸出,還是返回完整序列。請注意,如果為 True,weight_column 必須為 None 或字符串。
  • model_dir 保存模型參數、圖形等的目錄。這也可用於將檢查點從目錄加載到估計器中,以繼續訓練先前保存的模型。
  • n_classes 標簽類別的數量。默認為2,即二分類。必須 > 1。
  • weight_column tf.feature_column.numeric_column 創建的字符串或 NumericColumn 定義表示權重的特征列。它用於在訓練期間減輕重量或增加示例。它將乘以示例的損失。如果它是一個字符串,它被用作從 features 中獲取權重張量的鍵。如果是 NumericColumn ,則通過鍵 weight_column.key 獲取原始張量,然後對其應用 weight_column.normalizer_fn 以獲得權​​重張量。
  • label_vocabulary 字符串列表表示可能的標簽值。如果給定,標簽必須是字符串類型並且在 label_vocabulary 中具有任何值。如果沒有給出,這意味著標簽已經編碼為整數或在 [0, 1] 內為 n_classes=2 和在 {0, 1,..., n_classes-1} 中編碼為整數值 n_classes > 2.如果沒有提供詞匯並且標簽是字符串,也會出現錯誤。
  • optimizer tf.Optimizer 的實例或指定優化器類型的字符串。默認為 Adagrad 優化器。
  • loss_reduction tf.losses.Reduction 之一,除了 NONE 。說明如何減少批量訓練損失。默認為 SUM_OVER_BATCH_SIZE
  • sequence_mask 具有序列掩碼張量名稱的字符串。如果sequence_mask 在特征字典中,則使用提供的張量,否則從序列特征的長度計算序列掩碼。序列掩碼用於評估和訓練模式以匯總損失和度量計算,同時排除填充步驟。它還在預測模式下添加到預測字典中,以指示哪些步驟正在填充。
  • config RunConfig 對象來配置運行時設置。

拋出

  • ValueError 如果 units , cell_typernn_cell_fn 不兼容。

屬性

  • config
  • model_dir
  • model_fn 返回綁定到 self.paramsmodel_fn
  • params

訓練循環神經網絡模型以將實例分類為多個類之一。

例子:

token_sequence = sequence_categorical_column_with_hash_bucket(...)
token_emb = embedding_column(categorical_column=token_sequence, ...)

estimator = RNNClassifier(
    sequence_feature_columns=[token_emb],
    units=[32, 16], cell_type='lstm')

# Input builders
def input_fn_train:# returns x, y
  pass
estimator.train(input_fn=input_fn_train, steps=100)

def input_fn_eval:# returns x, y
  pass
metrics = estimator.evaluate(input_fn=input_fn_eval, steps=10)
def input_fn_predict:# returns x, None
  pass
predictions = estimator.predict(input_fn=input_fn_predict)

trainevaluate 的輸入應具有以下特征,否則會出現 KeyError

  • 如果 weight_column 不是 None ,則具有 key=weight_column 的特征,其值為 Tensor
  • 對於每個columnsequence_feature_columns
    • 具有 key=column.name 的函數,其 valueSparseTensor
  • 對於每個columncontext_feature_columns
    • 如果 columnCategoricalColumn ,則具有 key=column.name 的特征,其 valueSparseTensor
    • 如果 columnWeightedCategoricalColumn ,則有兩個特征:第一個具有 key id 列名,第二個具有 key 權重列名。兩個函數的 value 必須是 SparseTensor
    • 如果 columnDenseColumn ,則具有 key=column.name 的特征,其 valueTensor

損失是通過使用 softmax 交叉熵來計算的。

相關用法


注:本文由純淨天空篩選整理自tensorflow.org大神的英文原創作品 tf.estimator.experimental.RNNClassifier。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。