Python pyspark Series.str.match用法及代碼示例

本文簡要介紹 pyspark.pandas.Series.str.match 的用法。

用法: str.match(pat: str, case: bool = True, flags: int = 0, na: Any = nan) → ps.Series

確定每個字符串是否與正則表達式匹配。

類似於 contains() ，但更嚴格，依賴於 re.match() 而不是 re.search() 。

參數：

pat：str: 字符序列或正則表達式。
case：布爾值，默認為真: 如果為 True，則區分大小寫。
flags：int，默認 0(無標誌): 傳遞給 re 模塊的標誌，例如重新忽略。
na：默認NaN: 填充缺失值的值。

一係列布爾值或對象: 一個布爾值係列，指示給定模式是否可以在係列的每個元素的字符串中匹配。

例子：

>>> s = ps.Series(['Mouse', 'dog', 'house and parrot', '23', np.NaN])
>>> s.str.match('dog')
0    False
1     True
2    False
3    False
4     None
dtype: object

>>> s.str.match('mouse|dog', case=False)
0     True
1     True
2    False
3    False
4     None
dtype: object

>>> s.str.match('.+and.+', na=True)
0    False
1    False
2     True
3    False
4     True
dtype: bool

>>> import re
>>> s.str.match('MOUSE', flags=re.IGNORECASE)
0     True
1    False
2    False
3    False
4     None
dtype: object

相關用法

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.str.match。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

用法:

參數：

返回：

例子：