當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python PySpark SQL Functions trim方法用法及代碼示例


PySpark SQL 函數的 trim(~) 方法返回一個新的 PySpark 列,其中字符串值被修剪,即刪除了前導和尾隨空格。

參數

1. col | string

要修剪的 string 類型的列。

返回值

新的 PySpark 列。

例子

考慮以下PySpark DataFrame:

df = spark.createDataFrame([["  Alex  ", 20], ["  Bob", 30], ["Cathy    ", 40]], ["name", "age"])
df.show()



+---------+---+
|     name|age|
+---------+---+
|   Alex  | 20|
|      Bob| 30|
|Cathy    | 40|
+---------+---+

此處,name 列中的值具有前導空格和尾隨空格。

修剪PySpark中的列

修剪 name 列,即刪除前導和尾隨空格:

import pyspark.sql.functions as F
df.select(F.trim("name").alias("trimmed_name")).show()



+------------+
|trimmed_name|
+------------+
|        Alex|
|         Bob|
|       Cathy|
+------------+

這裏, alias(~) 方法用於為 trim(~) 返回的 Column 分配標簽。

要獲取原始 PySpark DataFrame,但使用修剪後的版本更新 name 列,請使用 withColumn(~) 方法:

df.withColumn("name", F.trim("name").alias("trimmed_name")).show()



+-----+---+
| name|age|
+-----+---+
| Alex| 20|
|  Bob| 30|
|Cathy| 40|
+-----+---+

相關用法


注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 PySpark SQL Functions | trim method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。