当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python tf.strings.to_hash_bucket_strong用法及代码示例


通过多个桶将输入张量中的每个字符串转换为其哈希模型。

用法

tf.strings.to_hash_bucket_strong(
    input, num_buckets, key, name=None
)

参数

  • input Tensor 类型为 string 。分配哈希桶的字符串。
  • num_buckets int>= 1 。桶的数量。
  • key ints 的列表。用于种子哈希函数的键,作为两个 uint64 元素的列表传递。
  • name 操作的名称(可选)。

返回

  • Tensor 类型为 int64

哈希函数对进程中字符串的内容是确定性的。散列函数是键控散列函数,其中属性key定义散列函数的键。 key 是一个包含 2 个元素的数组。

当输入可能是恶意的时,强哈希很重要,例如带有附加组件的 URL。攻击者可能会尝试将他们的输入散列到同一个桶中以进行denial-of-service 攻击或扭曲结果。强散列可用于使在桶上具有偏斜散列值分布的输入变得困难。这要求散列函数由对手未知的high-entropy(随机)"key" 播种。

额外的鲁棒性的代价是计算时间比 tf.string_to_hash_bucket_fast 高出大约 4 倍。

例子:

tf.strings.to_hash_bucket_strong(["Hello", "TF"], 3, [1, 2]).numpy()
array([2, 0])

相关用法


注:本文由纯净天空筛选整理自tensorflow.org大神的英文原创作品 tf.strings.to_hash_bucket_strong。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。