當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python cudf.core.column.string.StringMethods.filter_tokens用法及代碼示例


用法:

StringMethods.filter_tokens(min_token_length: int, replacement: str = None, delimiter: str = None) → SeriesOrIndex

從係列中的每個字符串中刪除小於 min_token_length 的標記,並可選擇將它們替換為替換字符串。令牌由提供的分隔符標識。

參數

min_token_length: int

要保留在輸出字符串中的標記的最小字符數。

replacementstr

用於代替已移除標記的字符串。

delimiterstr

用於定位每個字符串的標記的字符。默認為空格。

返回

對象的係列或索引。

例子

>>> import cudf
>>> sr = cudf.Series(["this is me", "theme music", ""])
>>> sr.str.filter_tokens(3, replacement="_")
0       this _ _
1    theme music
2
dtype: object
>>> sr = cudf.Series(["this;is;me", "theme;music", ""])
>>> sr.str.filter_tokens(5,None,";")
0             ;;
1    theme;music
2
dtype: object

相關用法


注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cudf.core.column.string.StringMethods.filter_tokens。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。