当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python PySpark SQL Functions lower方法用法及代码示例


PySpark SQL 函数的 lower(~) 方法返回新的 PySpark Column,其中指定列小写。

参数

1.col | stringColumn

要执行小写操作的列。

返回值

PySpark 列 (pyspark.sql.column.Column)。

例子

考虑以下PySpark DataFrame:

df = spark.createDataFrame([["ALEX", 25], ["BoB", 30]], ["name", "age"])
df.show()



+----+---+
|name|age|
+----+---+
|ALEX| 25|
| BoB| 30|
+----+---+

PySpark DataFrame 中的小写字符串

要将 name 列中的字符串小写:

import pyspark.sql.functions as F
df.select(F.lower(df.name)).show()



+-----------+
|lower(name)|
+-----------+
|       alex|
|        bob|
+-----------+

请注意,将列标签作为字符串传递也可以:

import pyspark.sql.functions as F
df.select(F.lower("name")).show()



+-----------+
|lower(name)|
+-----------+
|       alex|
|        bob|
+-----------+

将 PySpark 中的列替换为小写列

要将 name 列替换为小写版本,请使用 withColumn(~)

import pyspark.sql.functions as F
df.withColumn("name", F.lower(df.name)).show()



+----+---+
|name|age|
+----+---+
|alex| 25|
| bob| 30|
+----+---+

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 PySpark SQL Functions | lower method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。