用法:
StringMethods.filter_tokens(min_token_length: int, replacement: str = None, delimiter: str = None) → SeriesOrIndex
从系列中的每个字符串中删除小于 min_token_length 的标记,并可选择将它们替换为替换字符串。令牌由提供的分隔符标识。
- min_token_length: int:
要保留在输出字符串中的标记的最小字符数。
- replacement:str
用于代替已移除标记的字符串。
- delimiter:str
用于定位每个字符串的标记的字符。默认为空格。
- 对象的系列或索引。
参数:
返回:
例子:
>>> import cudf >>> sr = cudf.Series(["this is me", "theme music", ""]) >>> sr.str.filter_tokens(3, replacement="_") 0 this _ _ 1 theme music 2 dtype: object >>> sr = cudf.Series(["this;is;me", "theme;music", ""]) >>> sr.str.filter_tokens(5,None,";") 0 ;; 1 theme;music 2 dtype: object
相关用法
- Python cudf.core.column.string.StringMethods.filter_alphanum用法及代码示例
- Python cudf.core.column.string.StringMethods.filter_characters用法及代码示例
- Python cudf.core.column.string.StringMethods.find用法及代码示例
- Python cudf.core.column.string.StringMethods.findall用法及代码示例
- Python cudf.core.column.string.StringMethods.is_vowel用法及代码示例
- Python cudf.core.column.string.StringMethods.endswith用法及代码示例
- Python cudf.core.column.string.StringMethods.title用法及代码示例
- Python cudf.core.column.string.StringMethods.contains用法及代码示例
- Python cudf.core.column.string.StringMethods.rsplit用法及代码示例
- Python cudf.core.column.string.StringMethods.zfill用法及代码示例
- Python cudf.core.column.string.StringMethods.hex_to_int用法及代码示例
- Python cudf.core.column.string.StringMethods.htoi用法及代码示例
- Python cudf.core.column.string.StringMethods.character_tokenize用法及代码示例
- Python cudf.core.column.string.StringMethods.normalize_characters用法及代码示例
- Python cudf.core.column.string.StringMethods.split用法及代码示例
- Python cudf.core.column.string.StringMethods.ngrams用法及代码示例
- Python cudf.core.column.string.StringMethods.replace_with_backrefs用法及代码示例
- Python cudf.core.column.string.StringMethods.insert用法及代码示例
- Python cudf.core.column.string.StringMethods.pad用法及代码示例
- Python cudf.core.column.string.StringMethods.replace用法及代码示例
注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.core.column.string.StringMethods.filter_tokens。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。