當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python PySpark SQL Functions repeat方法用法及代碼示例


PySpark SQL 函數的repeat(~) 方法重複字符串值n 次。

參數

1.col | stringColumn

要執行重複的string-typed 列。

2. n | int

重複字符串值的次數。

返回值

PySpark 列 (pyspark.sql.column.Column)。

例子

考慮以下PySpark DataFrame:

df = spark.createDataFrame([["Alex", 20], ["Bob", 30]], ["name", "age"])
df.show()



+----+---+
|name|age|
+----+---+
|Alex| 20|
| Bob| 30|
+----+---+

在 PySpark 列中複製字符串值

重複 name 列中的值兩次:

import pyspark.sql.functions as F
df.select(F.repeat("name", 2)).show()



+---------------+
|repeat(name, 2)|
+---------------+
|       AlexAlex|
|         BobBob|
+---------------+

請注意,我們還可以向 repeat(~) 提供 Column 對象,如下所示:

import pyspark.sql.functions as F
# df.select(F.repeat(df.name), 2)).show()
df.select(F.repeat(F.col("name"), 2)).show()



+---------------+
|repeat(name, 2)|
+---------------+
|       AlexAlex|
|         BobBob|
+---------------+

相關用法


注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 PySpark SQL Functions | repeat method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。