当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cudf.core.column.string.StringMethods.filter_tokens用法及代码示例


用法:

StringMethods.filter_tokens(min_token_length: int, replacement: str = None, delimiter: str = None) → SeriesOrIndex

从系列中的每个字符串中删除小于 min_token_length 的标记,并可选择将它们替换为替换字符串。令牌由提供的分隔符标识。

参数

min_token_length: int

要保留在输出字符串中的标记的最小字符数。

replacementstr

用于代替已移除标记的字符串。

delimiterstr

用于定位每个字符串的标记的字符。默认为空格。

返回

对象的系列或索引。

例子

>>> import cudf
>>> sr = cudf.Series(["this is me", "theme music", ""])
>>> sr.str.filter_tokens(3, replacement="_")
0       this _ _
1    theme music
2
dtype: object
>>> sr = cudf.Series(["this;is;me", "theme;music", ""])
>>> sr.str.filter_tokens(5,None,";")
0             ;;
1    theme;music
2
dtype: object

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.core.column.string.StringMethods.filter_tokens。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。