PySpark 列的 contains(~)
方法返回布尔值的 Column
对象,其中 True
对应于包含指定子字符串的列值。
参数
1.other
| string
或 Column
用于执行检查的字符串或Column
。
返回值
布尔值的 Column
对象。
例子
考虑以下PySpark DataFrame:
df = spark.createDataFrame([["Alex", 20], ["Bob", 30], ["Cathy", 40]], ["name", "age"])
df.show()
+-----+---+
| name|age|
+-----+---+
| Alex| 20|
| Bob| 30|
|Cathy| 40|
+-----+---+
获取 PySpark DataFrame 中包含子字符串的行
要获取包含子字符串 "le"
的行:
from pyspark.sql import functions as F
df.filter(F.col("name").contains("le")).show()
+----+---+
|name|age|
+----+---+
|Alex| 20|
+----+---+
在这里,F.col("name").contains("le")
返回一个包含布尔值的 Column
对象,其中 True
对应于包含子字符串 "le"
的字符串:
df.select(F.col("name").contains("le")).show()
+------------------+
|contains(name, le)|
+------------------+
| true|
| false|
| false|
+------------------+
在我们的解决方案中,我们使用 filter(~)
方法来提取与 True
对应的行。
相关用法
- Python PySpark Column cast方法用法及代码示例
- Python PySpark Column isNotNull方法用法及代码示例
- Python PySpark Column getItem方法用法及代码示例
- Python PySpark Column rlike方法用法及代码示例
- Python PySpark Column withField方法用法及代码示例
- Python PySpark Column endswith方法用法及代码示例
- Python PySpark Column dropFields方法用法及代码示例
- Python PySpark Column alias方法用法及代码示例
- Python PySpark Column isNull方法用法及代码示例
- Python PySpark Column otherwise方法用法及代码示例
- Python PySpark Column startswith方法用法及代码示例
- Python PySpark Column isin方法用法及代码示例
- Python PySpark Column substr方法用法及代码示例
- Python Collections.UserString用法及代码示例
- Python Collections.UserDict用法及代码示例
- Python Collections.UserList用法及代码示例
- Python Django Collate用法及代码示例
- Python Django ContentTypeManager用法及代码示例
- Python Condition release()用法及代码示例
- Python Condition notify()用法及代码示例
- Python Django ContextMixin.get_context_data用法及代码示例
- Python Condition wait()用法及代码示例
- Python Django Coalesce用法及代码示例
- Python Django Cot用法及代码示例
- Python Django CoordTransform用法及代码示例
注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 PySpark Column | contains method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。