当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cudf.core.column.string.StringMethods.tokenize用法及代码示例


用法:

StringMethods.tokenize(delimiter: str = ' ') → SeriesOrIndex

使用提供的分隔符将每个字符串拆分为标记。返回的序列按找到的顺序包含标记。

参数

delimiterstr 或 str 列表,默认为空格。

用于定位每个字符串的分割点的字符串。

返回

对象的系列或索引。

例子

>>> import cudf
>>> data = ["hello world", "goodbye world", "hello goodbye"]
>>> ser = cudf.Series(data)
>>> ser.str.tokenize()
0      hello
1      world
2    goodbye
3      world
4      hello
5    goodbye
dtype: object

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.core.column.string.StringMethods.tokenize。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。