当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cudf.core.column.string.StringMethods.count用法及代码示例


用法:

StringMethods.count(pat: str, flags: int = 0) → SeriesOrIndex

计算系列/索引的每个字符串中模式的出现次数。

此函数用于计算特定正则表达式模式在系列的每个字符串元素中重复的次数。

参数

patstr 或编译的正则表达式

有效的正则表达式。

flagsint,默认 0(无标志)

传递给正则表达式引擎的标志(例如 re.MULTILINE)

返回

系列或索引

注意

  • flags参数目前只支持re.DOTALL和re.MULTILINE。
  • 有些字符在传入 pat 时需要转义。例如'$' 在正则表达式中有特殊含义,在找到这个字面字符时必须进行转义。

例子

>>> import cudf
>>> s = cudf.Series(['A', 'B', 'Aaba', 'Baca', None, 'CABA', 'cat'])
>>> s.str.count('a')
0       0
1       0
2       2
3       2
4    <NA>
5       0
6       1
dtype: int32

转义 '$' 以找到文字美元符号。

>>> s = cudf.Series(['$', 'B', 'Aab$', '$$ca', 'C$B$', 'cat'])
>>> s.str.count('\$')
0    1
1    0
2    1
3    2
4    2
5    0
dtype: int32

这也可以在 Index 上找到。

>>> index = cudf.Index(['A', 'A', 'Aaba', 'cat'])
>>> index.str.count('a')
Int64Index([0, 0, 2, 1], dtype='int64')

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.core.column.string.StringMethods.count。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。