当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cudf.core.column.string.StringMethods.character_tokenize用法及代码示例


用法:

StringMethods.character_tokenize() → SeriesOrIndex

每个字符串被分割成单独的字符。返回的序列包含每个字符作为单独的字符串。

返回

对象的系列或索引。

例子

>>> import cudf
>>> data = ["hello world", None, "goodbye, thank you."]
>>> ser = cudf.Series(data)
>>> ser.str.character_tokenize()
0     h
1     e
2     l
3     l
4     o
5
6     w
7     o
8     r
9     l
10    d
11    g
12    o
13    o
14    d
15    b
16    y
17    e
18    ,
19
20    t
21    h
22    a
23    n
24    k
25
26    y
27    o
28    u
29    .
dtype: object

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.core.column.string.StringMethods.character_tokenize。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。