当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python PySpark SQL Functions least方法用法及代码示例


PySpark SQL 函数的 least(~) 将多个列作为输入,并返回一个 PySpark 列,其中保存输入列的每一行的最小值。

参数

1.*cols | stringColumn

将比较其行值以进行检查的输入列。

返回值

PySpark 数据帧。

例子

考虑以下PySpark DataFrame:

df = spark.createDataFrame([[20,10], [30,50], [40,90]], ["A", "B"])
df.show()



+---+---+
|  A|  B|
+---+---+
| 20| 10|
| 30| 50|
| 40| 90|
+---+---+

获取PySpark中指定列的每一行的最小值

要获取 AB 列的每一行的最小值:

import pyspark.sql.functions as F
df.select(F.least("A","B")).show()



+-----------+
|least(A, B)|
+-----------+
|         10|
|         30|
|         40|
+-----------+

我们还可以传递 Column 对象而不是列标签:

df.select(F.least(df.A,df.B)).show()



+-----------+
|least(A, B)|
+-----------+
|         10|
|         30|
|         40|
+-----------+

请注意,我们可以使用 withColumn(~) 附加由 least(~) 返回的 Column

df.withColumn("smallest", F.least("A","B")).show()



+---+---+--------+
|  A|  B|smallest|
+---+---+--------+
| 20| 10|      10|
| 30| 50|      30|
| 40| 90|      40|
+---+---+--------+

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 PySpark SQL Functions | least method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。