当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Series.str.findall用法及代码示例


本文简要介绍 pyspark.pandas.Series.str.findall 的用法。

用法:

str.findall(pat: str, flags: int = 0) → ps.Series

查找系列中所有出现的模式或正则表达式。

相当于将re.findall() 应用于系列中的所有元素。

参数

patstr

模式或正则表达式。

flagsint,默认 0(无标志)

re 模块标志,例如re.IGNORECASE

返回

系列对象

此系列的每个字符串中的模式或正则表达式的所有非重叠匹配。

例子

>>> s = ps.Series(['Lion', 'Monkey', 'Rabbit'])

搜索模式“Monkey”会返回一个匹配项:

>>> s.str.findall('Monkey')
0          []
1    [Monkey]
2          []
dtype: object

另一方面,模式“MONKEY”的搜索不返回任何匹配:

>>> s.str.findall('MONKEY')
0    []
1    []
2    []
dtype: object

可以将标志添加到模式或正则表达式中。例如,要找到忽略大小写的模式“MONKEY”:

>>> import re
>>> s.str.findall('MONKEY', flags=re.IGNORECASE)
0          []
1    [Monkey]
2          []
dtype: object

当模式匹配 Series 中的多个字符串时,返回所有匹配项:

>>> s.str.findall('on')
0    [on]
1    [on]
2      []
dtype: object

也支持正则表达式。例如,搜索以单词‘on’ 结尾的所有字符串如下所示:

>>> s.str.findall('on$')
0    [on]
1      []
2      []
dtype: object

如果在同一个字符串中多次找到该模式,则返回多个字符串的列表:

>>> s.str.findall('b')
0        []
1        []
2    [b, b]
dtype: object

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.str.findall。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。