當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python PySpark DataFrame limit方法用法及代碼示例


PySpark DataFrame 的 limit(~) 方法返回一個新的 DataFrame,其中包含指定的行數。

參數

1. num | number

返回所需的行數。

返回值

PySpark 數據幀 (pyspark.sql.dataframe.DataFrame)。

例子

考慮以下PySpark DataFrame:

columns = ["name", "age"]
data = [("Alex", 15), ("Bob", 20), ("Cathy", 25)]
df = spark.createDataFrame(data, columns)
df.show()



+-----+-----+
| name|  age|
+-----+-----+
| Alex|   15|
|  Bob|   20|
|Cathy|   25|
+-----+-----+

使用 limit 獲取 PySpark DataFrame 的行子集

要限製返回到 2 的行數:

df.limit(2).show()



+----+----+
| age|name|
+----+----+
|Alex|  15|
| Bob|  20|
+----+----+

請注意, show(~) 方法實際上有一個限製打印行數的參數:

df.show(n=2)



+----+----+
| age|name|
+----+----+
|Alex|  15|
| Bob|  20|
+----+----+

相關用法


注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 PySpark DataFrame | limit method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。