當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark Series.str.match用法及代碼示例


本文簡要介紹 pyspark.pandas.Series.str.match 的用法。

用法:

str.match(pat: str, case: bool = True, flags: int = 0, na: Any = nan) → ps.Series

確定每個字符串是否與正則表達式匹配。

類似於 contains() ,但更嚴格,依賴於 re.match() 而不是 re.search()

參數

patstr

字符序列或正則表達式。

case布爾值,默認為真

如果為 True,則區分大小寫。

flagsint,默認 0(無標誌)

傳遞給 re 模塊的標誌,例如重新忽略。

na默認NaN

填充缺失值的值。

返回

一係列布爾值或對象

一個布爾值係列,指示給定模式是否可以在係列的每個元素的字符串中匹配。

例子

>>> s = ps.Series(['Mouse', 'dog', 'house and parrot', '23', np.NaN])
>>> s.str.match('dog')
0    False
1     True
2    False
3    False
4     None
dtype: object
>>> s.str.match('mouse|dog', case=False)
0     True
1     True
2    False
3    False
4     None
dtype: object
>>> s.str.match('.+and.+', na=True)
0    False
1    False
2     True
3    False
4     True
dtype: bool
>>> import re
>>> s.str.match('MOUSE', flags=re.IGNORECASE)
0     True
1    False
2    False
3    False
4     None
dtype: object

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.str.match。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。