DenseColumn
从稀疏的分类输入转换而来。
用法
tf.feature_column.embedding_column(
categorical_column, dimension, combiner='mean', initializer=None,
ckpt_to_load_from=None, tensor_name_in_ckpt=None, max_norm=None, trainable=True,
use_safe_embedding_lookup=True
)
参数
-
categorical_column
由categorical_column_with_*
函数创建的CategoricalColumn
。此列生成作为嵌入查找输入的稀疏 ID。 -
dimension
指定嵌入维度的整数,必须 > 0。 -
combiner
一个字符串,指定在一行中有多个条目时如何减少。目前支持'mean'、'sqrtn'和'sum',默认为'mean'。 'sqrtn' 通常可以达到很好的准确性,特别是对于 bag-of-words 列。这些中的每一个都可以被认为是列上的示例级别规范化。有关详细信息,请参阅tf.embedding_lookup_sparse
。 -
initializer
用于嵌入变量初始化的变量初始化函数。如果未指定,则默认为truncated_normal_initializer
,平均值为0.0
和标准差1/sqrt(dimension)
。 -
ckpt_to_load_from
表示要从中恢复列权重的检查点名称/模式的字符串。如果tensor_name_in_ckpt
不是None
则为必需。 -
tensor_name_in_ckpt
ckpt_to_load_from
中Tensor
的名称,从中恢复列权重。如果ckpt_to_load_from
不是None
则需要。 -
max_norm
如果不是None
,则嵌入值被 l2 标准化为该值。 -
trainable
嵌入是否可训练。默认为真。 -
use_safe_embedding_lookup
如果为真,则使用 safe_embedding_lookup_sparse 而不是 embedding_lookup_sparse。 safe_embedding_lookup_sparse 确保没有空行,并且所有权重和 id 都是正数,但代价是额外的计算成本。这仅适用于 rank 2 (NxM) 形状的输入张量。默认为 true,如果不需要上述检查,请考虑关闭。请注意,尽管输出结果可能为 0 或省略,但具有空行不会触发任何错误。
返回
-
DenseColumn
从稀疏输入转换而来。
抛出
-
ValueError
如果dimension
不 > 0。 -
ValueError
如果指定了ckpt_to_load_from
和tensor_name_in_ckpt
之一。 -
ValueError
如果initializer
已指定且不可调用。 -
RuntimeError
如果启用了即刻执行。
当您的输入是稀疏的,但您想将它们转换为密集表示(例如,馈送到 DNN)时,请使用此选项。
输入必须是由任何 categorical_column_*
函数创建的 CategoricalColumn
。以下是使用 embedding_column
和 DNNClassifier
的示例:
video_id = categorical_column_with_identity(
key='video_id', num_buckets=1000000, default_value=0)
columns = [embedding_column(video_id, 9),...]
estimator = tf.estimator.DNNClassifier(feature_columns=columns, ...)
label_column = ...
def input_fn():
features = tf.io.parse_example(
..., features=make_parse_example_spec(columns + [label_column]))
labels = features.pop(label_column.name)
return features, labels
estimator.train(input_fn=input_fn, steps=100)
这是一个使用 embedding_column
和 model_fn 的示例:
def model_fn(features, ...):
video_id = categorical_column_with_identity(
key='video_id', num_buckets=1000000, default_value=0)
columns = [embedding_column(video_id, 9),...]
dense_tensor = input_layer(features, columns)
# Form DNN layers, calculate loss, and return EstimatorSpec.
...
相关用法
- Python tf.feature_column.crossed_column用法及代码示例
- Python tf.feature_column.sequence_categorical_column_with_identity用法及代码示例
- Python tf.feature_column.categorical_column_with_vocabulary_list用法及代码示例
- Python tf.feature_column.categorical_column_with_hash_bucket用法及代码示例
- Python tf.feature_column.bucketized_column用法及代码示例
- Python tf.feature_column.categorical_column_with_identity用法及代码示例
- Python tf.feature_column.sequence_numeric_column用法及代码示例
- Python tf.feature_column.sequence_categorical_column_with_vocabulary_file用法及代码示例
- Python tf.feature_column.sequence_categorical_column_with_vocabulary_list用法及代码示例
- Python tf.feature_column.sequence_categorical_column_with_hash_bucket用法及代码示例
- Python tf.feature_column.shared_embeddings用法及代码示例
- Python tf.feature_column.categorical_column_with_vocabulary_file用法及代码示例
- Python tf.feature_column.indicator_column用法及代码示例
- Python tf.feature_column.weighted_categorical_column用法及代码示例
- Python tf.feature_column.numeric_column用法及代码示例
- Python tf.feature_column.make_parse_example_spec用法及代码示例
- Python tf.function用法及代码示例
- Python tf.fingerprint用法及代码示例
- Python tf.foldl用法及代码示例
- Python tf.foldr用法及代码示例
注:本文由纯净天空筛选整理自tensorflow.org大神的英文原创作品 tf.feature_column.embedding_column。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。