用法:
StringMethods.character_ngrams(n: int = 2, as_list: bool = False) → SeriesOrIndex
从字符串列中的字符生成n-grams。
- n:int
n-gram 的度数(连续字符数)。对于二元组,默认值为 2。
- as_list:bool
设置为 True 以在列表列中返回 ngram,其中每个列表元素是每个字符串的 ngram。
参数:
例子:
>>> import cudf >>> str_series = cudf.Series(['abcd','efgh','xyz']) >>> str_series.str.character_ngrams(2) 0 ab 1 bc 2 cd 3 ef 4 fg 5 gh 6 xy 7 yz dtype: object >>> str_series.str.character_ngrams(3) 0 abc 1 bcd 2 efg 3 fgh 4 xyz dtype: object >>> str_series.str.character_ngrams(3,True) 0 [abc, bcd] 1 [efg, fgh] 2 [xyz] dtype: list
相关用法
- Python cudf.core.column.string.StringMethods.character_tokenize用法及代码示例
- Python cudf.core.column.string.StringMethods.contains用法及代码示例
- Python cudf.core.column.string.StringMethods.cat用法及代码示例
- Python cudf.core.column.string.StringMethods.code_points用法及代码示例
- Python cudf.core.column.string.StringMethods.capitalize用法及代码示例
- Python cudf.core.column.string.StringMethods.center用法及代码示例
- Python cudf.core.column.string.StringMethods.count用法及代码示例
- Python cudf.core.column.string.StringMethods.is_vowel用法及代码示例
- Python cudf.core.column.string.StringMethods.endswith用法及代码示例
- Python cudf.core.column.string.StringMethods.title用法及代码示例
- Python cudf.core.column.string.StringMethods.rsplit用法及代码示例
- Python cudf.core.column.string.StringMethods.zfill用法及代码示例
- Python cudf.core.column.string.StringMethods.hex_to_int用法及代码示例
- Python cudf.core.column.string.StringMethods.htoi用法及代码示例
- Python cudf.core.column.string.StringMethods.normalize_characters用法及代码示例
- Python cudf.core.column.string.StringMethods.filter_alphanum用法及代码示例
- Python cudf.core.column.string.StringMethods.split用法及代码示例
- Python cudf.core.column.string.StringMethods.ngrams用法及代码示例
- Python cudf.core.column.string.StringMethods.replace_with_backrefs用法及代码示例
- Python cudf.core.column.string.StringMethods.insert用法及代码示例
注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.core.column.string.StringMethods.character_ngrams。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。