Python tf.strings.to_hash_bucket_strong用法及代码示例

通过多个桶将输入张量中的每个字符串转换为其哈希模型。

用法

tf.strings.to_hash_bucket_strong(
    input, num_buckets, key, name=None
)

哈希函数对进程中字符串的内容是确定性的。散列函数是键控散列函数，其中属性key定义散列函数的键。 key 是一个包含 2 个元素的数组。

当输入可能是恶意的时，强哈希很重要，例如带有附加组件的 URL。攻击者可能会尝试将他们的输入散列到同一个桶中以进行denial-of-service 攻击或扭曲结果。强散列可用于使在桶上具有偏斜散列值分布的输入变得困难。这要求散列函数由对手未知的high-entropy(随机)"key" 播种。

额外的鲁棒性的代价是计算时间比 tf.string_to_hash_bucket_fast 高出大约 4 倍。

tf.strings.to_hash_bucket_strong(["Hello", "TF"], 3, [1, 2]).numpy()
array([2, 0])

相关用法

注：本文由纯净天空筛选整理自tensorflow.org大神的英文原创作品 tf.strings.to_hash_bucket_strong。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。