當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python PySpark SQL Functions least方法用法及代碼示例

PySpark SQL 函數的 least(~) 將多個列作為輸入,並返回一個 PySpark 列,其中保存輸入列的每一行的最小值。

參數

1.*cols | stringColumn

將比較其行值以進行檢查的輸入列。

返回值

PySpark 數據幀。

例子

考慮以下PySpark DataFrame:

df = spark.createDataFrame([[20,10], [30,50], [40,90]], ["A", "B"])
df.show()



+---+---+
|  A|  B|
+---+---+
| 20| 10|
| 30| 50|
| 40| 90|
+---+---+

獲取PySpark中指定列的每一行的最小值

要獲取 AB 列的每一行的最小值:

import pyspark.sql.functions as F
df.select(F.least("A","B")).show()



+-----------+
|least(A, B)|
+-----------+
|         10|
|         30|
|         40|
+-----------+

我們還可以傳遞 Column 對象而不是列標簽:

df.select(F.least(df.A,df.B)).show()



+-----------+
|least(A, B)|
+-----------+
|         10|
|         30|
|         40|
+-----------+

請注意,我們可以使用 withColumn(~) 附加由 least(~) 返回的 Column

df.withColumn("smallest", F.least("A","B")).show()



+---+---+--------+
|  A|  B|smallest|
+---+---+--------+
| 20| 10|      10|
| 30| 50|      30|
| 40| 90|      40|
+---+---+--------+

相關用法


注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 PySpark SQL Functions | least method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。