Python tf.nn.safe_embedding_lookup_sparse用法及代码示例

查找嵌入结果，考虑无效 ID 和空特征。

用法

tf.nn.safe_embedding_lookup_sparse(
    embedding_weights, sparse_ids, sparse_weights=None, combiner='mean',
    default_id=None, max_norm=None, name=None
)

参数

embedding_weights 表示完整嵌入张量的单个张量，或除第一个维度外所有相同形状的张量列表，表示遵循"div" 分区策略的分片嵌入张量。
sparse_ids SparseTensor 形状 [d_0, d_1, ..., d_n] 包含 id。 d_0 通常是批量大小。
sparse_weights SparseTensor 与 sparse_ids 形状相同，包含与 sparse_ids 或 None 对应的浮点权重，如果所有权重都假定为 1.0。
combiner 一个字符串，指定如何组合每个条目的嵌入结果。目前支持"mean"、"sqrtn"和"sum"，默认为"mean"。
default_id 用于没有特征的条目的 id。默认为 0 向量。
max_norm 如果不是 None ，则所有嵌入在组合之前都经过 l2 归一化为 max_norm。
name 此操作的名称(可选)。

表示稀疏 id 的组合嵌入的密集张量。对于由表示的密集张量中的每一行sparse_ids，op 查找该行中所有 id 的嵌入，将它们乘以相应的权重，并按指定组合这些嵌入。
换句话说，如果

shape(combined embedding_weights) = [p0, p1, ..., pm]

和

shape(sparse_ids) = shape(sparse_weights) = [d0, d1, ..., dn]

然后

shape(output) = [d0, d1, ... dn-1, p1, ..., pm] 。

例如，如果 params 是一个 10x20 矩阵，那么 sp_ids /sp_weights 是
```
[0, 0]:id 1, weight 2.0
  [0, 1]:id 3, weight 0.5
  [1, 0]:id -1, weight 1.0
  [2, 3]:id 1, weight 3.0
```
default_id 为 0。

使用combiner ="mean"，则输出将是一个 3x20 矩阵，其中
```
output[0,:] = (params[1,:] * 2.0 + params[3,:] * 0.5) / (2.0 + 0.5)
  output[1,:] = (params[0,:] * 1.0) / 1.0
  output[2,:] = (params[1,:] * 3.0) / 3.0
```

抛出

ValueError 如果embedding_weights 为空。

embedding_weights 中的分区嵌入必须是相同的形状，除了第一个维度。第一个维度允许变化，因为词汇量不一定是分片数量的倍数。

从输入 ID 和权重以及任何具有非正权重的 ID 中删除无效 ID (default_id 的嵌入向量，如果未提供 default_id，则返回 0 向量。

id 和权重可以是多维的。嵌入总是沿最后一个维度聚合。

如果 len(embedding_weights) > 1 ，则 ids 的每个元素 id 根据 "div" 分区策略在 embedding_weights 的元素之间进行分区，这意味着我们以连续的方式将 id 分配给分区。例如，13 个 id 被分成 5 个分区：[[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 10], [11, 12]]。

如果 id 空间不均分分区数，那么前(max_id + 1) % len(embedding_weights) 个分区中的每一个都会被分配一个多一个 id。

相关用法

注：本文由纯净天空筛选整理自tensorflow.org大神的英文原创作品 tf.nn.safe_embedding_lookup_sparse。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。