當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python cudf.core.column.string.StringMethods.character_tokenize用法及代碼示例


用法:

StringMethods.character_tokenize() → SeriesOrIndex

每個字符串被分割成單獨的字符。返回的序列包含每個字符作為單獨的字符串。

返回

對象的係列或索引。

例子

>>> import cudf
>>> data = ["hello world", None, "goodbye, thank you."]
>>> ser = cudf.Series(data)
>>> ser.str.character_tokenize()
0     h
1     e
2     l
3     l
4     o
5
6     w
7     o
8     r
9     l
10    d
11    g
12    o
13    o
14    d
15    b
16    y
17    e
18    ,
19
20    t
21    h
22    a
23    n
24    k
25
26    y
27    o
28    u
29    .
dtype: object

相關用法


注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cudf.core.column.string.StringMethods.character_tokenize。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。