當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python PySpark SQL Functions lower方法用法及代碼示例


PySpark SQL 函數的 lower(~) 方法返回新的 PySpark Column,其中指定列小寫。

參數

1.col | stringColumn

要執行小寫操作的列。

返回值

PySpark 列 (pyspark.sql.column.Column)。

例子

考慮以下PySpark DataFrame:

df = spark.createDataFrame([["ALEX", 25], ["BoB", 30]], ["name", "age"])
df.show()



+----+---+
|name|age|
+----+---+
|ALEX| 25|
| BoB| 30|
+----+---+

PySpark DataFrame 中的小寫字符串

要將 name 列中的字符串小寫:

import pyspark.sql.functions as F
df.select(F.lower(df.name)).show()



+-----------+
|lower(name)|
+-----------+
|       alex|
|        bob|
+-----------+

請注意,將列標簽作為字符串傳遞也可以:

import pyspark.sql.functions as F
df.select(F.lower("name")).show()



+-----------+
|lower(name)|
+-----------+
|       alex|
|        bob|
+-----------+

將 PySpark 中的列替換為小寫列

要將 name 列替換為小寫版本,請使用 withColumn(~)

import pyspark.sql.functions as F
df.withColumn("name", F.lower(df.name)).show()



+----+---+
|name|age|
+----+---+
|alex| 25|
| bob| 30|
+----+---+

相關用法


注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 PySpark SQL Functions | lower method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。