当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python PySpark Column rlike方法用法及代码示例


PySpark 列的 rlike(~) 方法返回布尔值 Column,其中 True 对应于与指定正则表达式匹配的字符串列值。

注意

rlike(~) 方法与 SQL 中的RLIKE 运算符相同。

参数

1. str | other

要匹配的正则表达式。

返回值

布尔值的 Column 对象。

例子

考虑以下PySpark DataFrame:

df = spark.createDataFrame([["Alex", 20], ["Bob", 30]], ["name", "age"])
df.show()



+----+---+
|name|age|
+----+---+
|Alex| 20|
| Bob| 30|
+----+---+

获取值与 PySpark DataFrame 中的某些正则表达式匹配的行

要获取值与某些正则表达式匹配的行:

from pyspark.sql import functions as F
df.filter(F.col("name").rlike("^A")).show()



+----+---+
|name|age|
+----+---+
|Alex| 20|
+----+---+

此处,正则表达式 "^A" 匹配以 "A" 开头的字符串。另外,F.col("name").rlike("^A") 返回布尔值的 Column 对象:

from pyspark.sql import functions as F
df.select(F.col("name").rlike("^A")).show()



+---------------+
|RLIKE(name, ^A)|
+---------------+
|           true|
|          false|
+---------------+

在我们的解决方案中,我们使用 filter(~) 方法仅获取与 True 对应的行。

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 PySpark Column | rlike method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。