當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python cudf.core.column.string.StringMethods.character_ngrams用法及代碼示例


用法:

StringMethods.character_ngrams(n: int = 2, as_list: bool = False) → SeriesOrIndex

從字符串列中的字符生成n-grams。

參數

nint

n-gram 的度數(連續字符數)。對於二元組,默認值為 2。

as_listbool

設置為 True 以在列表列中返回 ngram,其中每個列表元素是每個字符串的 ngram。

例子

>>> import cudf
>>> str_series = cudf.Series(['abcd','efgh','xyz'])
>>> str_series.str.character_ngrams(2)
0    ab
1    bc
2    cd
3    ef
4    fg
5    gh
6    xy
7    yz
dtype: object
>>> str_series.str.character_ngrams(3)
0    abc
1    bcd
2    efg
3    fgh
4    xyz
dtype: object
>>> str_series.str.character_ngrams(3,True)
0    [abc, bcd]
1    [efg, fgh]
2         [xyz]
dtype: list

相關用法


注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cudf.core.column.string.StringMethods.character_ngrams。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。