通过多个桶将输入张量中的每个字符串转换为其哈希模型。
用法
tf.strings.to_hash_bucket_strong(
input, num_buckets, key, name=None
)
参数
-
input
Tensor
类型为string
。分配哈希桶的字符串。 -
num_buckets
int
即>= 1
。桶的数量。 -
key
ints
的列表。用于种子哈希函数的键,作为两个 uint64 元素的列表传递。 -
name
操作的名称(可选)。
返回
-
Tensor
类型为int64
。
哈希函数对进程中字符串的内容是确定性的。散列函数是键控散列函数,其中属性key
定义散列函数的键。 key
是一个包含 2 个元素的数组。
当输入可能是恶意的时,强哈希很重要,例如带有附加组件的 URL。攻击者可能会尝试将他们的输入散列到同一个桶中以进行denial-of-service 攻击或扭曲结果。强散列可用于使在桶上具有偏斜散列值分布的输入变得困难。这要求散列函数由对手未知的high-entropy(随机)"key" 播种。
额外的鲁棒性的代价是计算时间比 tf.string_to_hash_bucket_fast
高出大约 4 倍。
例子:
tf.strings.to_hash_bucket_strong(["Hello", "TF"], 3, [1, 2]).numpy()
array([2, 0])
相关用法
- Python tf.strings.to_hash_bucket_fast用法及代码示例
- Python tf.strings.to_hash_bucket用法及代码示例
- Python tf.strings.to_number用法及代码示例
- Python tf.strings.substr用法及代码示例
- Python tf.strings.reduce_join用法及代码示例
- Python tf.strings.regex_full_match用法及代码示例
- Python tf.strings.regex_replace用法及代码示例
- Python tf.strings.length用法及代码示例
- Python tf.strings.bytes_split用法及代码示例
- Python tf.strings.as_string用法及代码示例
- Python tf.strings.unsorted_segment_join用法及代码示例
- Python tf.strings.lower用法及代码示例
- Python tf.strings.split用法及代码示例
- Python tf.strings.upper用法及代码示例
- Python tf.strings.unicode_decode_with_offsets用法及代码示例
- Python tf.strings.join用法及代码示例
- Python tf.strings.ngrams用法及代码示例
- Python tf.strings.unicode_decode用法及代码示例
- Python tf.strings.unicode_encode用法及代码示例
- Python tf.strings.format用法及代码示例
注:本文由纯净天空筛选整理自tensorflow.org大神的英文原创作品 tf.strings.to_hash_bucket_strong。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。