当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python PySpark SQL Functions repeat方法用法及代码示例


PySpark SQL 函数的repeat(~) 方法重复字符串值n 次。

参数

1.col | stringColumn

要执行重复的string-typed 列。

2. n | int

重复字符串值的次数。

返回值

PySpark 列 (pyspark.sql.column.Column)。

例子

考虑以下PySpark DataFrame:

df = spark.createDataFrame([["Alex", 20], ["Bob", 30]], ["name", "age"])
df.show()



+----+---+
|name|age|
+----+---+
|Alex| 20|
| Bob| 30|
+----+---+

在 PySpark 列中复制字符串值

重复 name 列中的值两次:

import pyspark.sql.functions as F
df.select(F.repeat("name", 2)).show()



+---------------+
|repeat(name, 2)|
+---------------+
|       AlexAlex|
|         BobBob|
+---------------+

请注意,我们还可以向 repeat(~) 提供 Column 对象,如下所示:

import pyspark.sql.functions as F
# df.select(F.repeat(df.name), 2)).show()
df.select(F.repeat(F.col("name"), 2)).show()



+---------------+
|repeat(name, 2)|
+---------------+
|       AlexAlex|
|         BobBob|
+---------------+

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 PySpark SQL Functions | repeat method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。