当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cudf.core.column.string.StringMethods.edit_distance_matrix用法及代码示例


用法:

StringMethods.edit_distance_matrix() → Union[cudf.Series, cudf.core.index.GenericIndex]

计算系列中字符串之间的编辑距离。

计算矩阵的系列应该有 2 个以上的字符串,并且不应包含空值。

编辑距离是根据 Levenshtein edit distance algorithm 测量的。

返回

ListDtype(int64) 系列

假设N 是这个系列的长度。返回系列包含大小为 NN 列表,其中系列的 `i`th 行中的 `j`th 数字表示 `i`th 字符串和 `j`th 字符串之间的编辑距离这个系列。矩阵是对称的。对角元素为 0。

例子

>>> import cudf
>>> s = cudf.Series(['abc', 'bc', 'cba'])
>>> s.str.edit_distance_matrix()
0    [0, 1, 2]
1    [1, 0, 2]
2    [2, 2, 0]
dtype: list

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.core.column.string.StringMethods.edit_distance_matrix。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。