当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Series.str.count用法及代码示例


本文简要介绍 pyspark.pandas.Series.str.count 的用法。

用法:

str.count(pat: str, flags: int = 0) → ps.Series

计算系列中每个字符串中模式的出现次数。

此函数用于计算特定正则表达式模式在系列的每个字符串元素中重复的次数。

参数

patstr

有效的正则表达式。

flagsint,默认 0(无标志)

re 模块的标志。

返回

int系列

包含模式匹配整数计数的系列。

例子

>>> s = ps.Series(['A', 'B', 'Aaba', 'Baca', np.NaN, 'CABA', 'cat'])
>>> s.str.count('a')
0    0.0
1    0.0
2    2.0
3    2.0
4    NaN
5    0.0
6    1.0
dtype: float64

转义“$”以找到文字美元符号。

>>> s = ps.Series(['$', 'B', 'Aab$', '$$ca', 'C$B$', 'cat'])
>>> s.str.count('\$')
0    1
1    0
2    1
3    2
4    2
5    0
dtype: int64

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.str.count。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。