当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Series.str.match用法及代码示例


本文简要介绍 pyspark.pandas.Series.str.match 的用法。

用法:

str.match(pat: str, case: bool = True, flags: int = 0, na: Any = nan) → ps.Series

确定每个字符串是否与正则表达式匹配。

类似于 contains() ,但更严格,依赖于 re.match() 而不是 re.search()

参数

patstr

字符序列或正则表达式。

case布尔值,默认为真

如果为 True,则区分大小写。

flagsint,默认 0(无标志)

传递给 re 模块的标志,例如重新忽略。

na默认NaN

填充缺失值的值。

返回

一系列布尔值或对象

一个布尔值系列,指示给定模式是否可以在系列的每个元素的字符串中匹配。

例子

>>> s = ps.Series(['Mouse', 'dog', 'house and parrot', '23', np.NaN])
>>> s.str.match('dog')
0    False
1     True
2    False
3    False
4     None
dtype: object
>>> s.str.match('mouse|dog', case=False)
0     True
1     True
2    False
3    False
4     None
dtype: object
>>> s.str.match('.+and.+', na=True)
0    False
1    False
2     True
3    False
4     True
dtype: bool
>>> import re
>>> s.str.match('MOUSE', flags=re.IGNORECASE)
0     True
1    False
2    False
3    False
4     None
dtype: object

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.str.match。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。