當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python PySpark DataFrame show方法用法及代碼示例


PySpark DataFrame 的show(~) 方法在控製台上打印DataFrame 的行。

參數

1.n | int | optional

要顯示的行數。默認情況下,n=20

2. truncate | booleanint | optional

  • 如果是 True ,則長度超過 20 個字符的字符串將被截斷。

  • 如果 False ,則將顯示整個字符串。

  • 如果是 int ,則長度超過 truncate 的字符串將被截斷。

如果發生截斷,則保留字符串的左側部分。默認情況下,truncate=True

3. vertical | boolean | optional

如果是 True ,則每列值打印一行。默認情況下,vertical=False

返回值

None

例子

考慮以下PySpark DataFrame:

columns = ["name", "age"]
data = [("Alex", 15), ("Bob", 20), ("Cathy", 25)]
df = spark.createDataFrame(data, columns)

打印 PySpark DataFrame 的前 n 行

要打印 PySpark DataFrame 的前 20 行:

df.show()   # n=20



+-----+---+
| name|age|
+-----+---+
| Alex| 15|
|  Bob| 20|
|Cathy| 25|
+-----+---+

要打印 DataFrame 的前 2 行:

df.show(n=2)



+----+---+
|name|age|
+----+---+
|Alex| 15|
| Bob| 20|
+----+---+
only showing top 2 rows

截斷 PySpark DataFrame 打印行中的字符串

截斷長度超過 2 的字符串:

df.show(truncate=2)



+----+---+
|name|age|
+----+---+
|  Al| 15|
|  Bo| 20|
|  Ca| 25|
+----+---+

禁用 PySpark DataFrame 打印行中的字符串截斷

要禁用打印行中字符串的截斷:

df.show(truncate=False)



+-----+---+
|name |age|
+-----+---+
|Alex |15 |
|Bob  |20 |
|Cathy|25 |
+-----+---+

垂直打印 PySpark DataFrame 行

要在單獨的行中打印每個列值:

df.show(vertical=True)



-RECORD 0-----
 name | Alex  
 age  | 15    
-RECORD 1-----
 name | Bob   
 age  | 20    
-RECORD 2-----
 name | Cathy 
 age  | 25

相關用法


注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 PySpark DataFrame | show method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。