当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python PySpark DataFrame show方法用法及代码示例


PySpark DataFrame 的show(~) 方法在控制台上打印DataFrame 的行。

参数

1.n | int | optional

要显示的行数。默认情况下,n=20

2. truncate | booleanint | optional

  • 如果是 True ,则长度超过 20 个字符的字符串将被截断。

  • 如果 False ,则将显示整个字符串。

  • 如果是 int ,则长度超过 truncate 的字符串将被截断。

如果发生截断,则保留字符串的左侧部分。默认情况下,truncate=True

3. vertical | boolean | optional

如果是 True ,则每列值打印一行。默认情况下,vertical=False

返回值

None

例子

考虑以下PySpark DataFrame:

columns = ["name", "age"]
data = [("Alex", 15), ("Bob", 20), ("Cathy", 25)]
df = spark.createDataFrame(data, columns)

打印 PySpark DataFrame 的前 n 行

要打印 PySpark DataFrame 的前 20 行:

df.show()   # n=20



+-----+---+
| name|age|
+-----+---+
| Alex| 15|
|  Bob| 20|
|Cathy| 25|
+-----+---+

要打印 DataFrame 的前 2 行:

df.show(n=2)



+----+---+
|name|age|
+----+---+
|Alex| 15|
| Bob| 20|
+----+---+
only showing top 2 rows

截断 PySpark DataFrame 打印行中的字符串

截断长度超过 2 的字符串:

df.show(truncate=2)



+----+---+
|name|age|
+----+---+
|  Al| 15|
|  Bo| 20|
|  Ca| 25|
+----+---+

禁用 PySpark DataFrame 打印行中的字符串截断

要禁用打印行中字符串的截断:

df.show(truncate=False)



+-----+---+
|name |age|
+-----+---+
|Alex |15 |
|Bob  |20 |
|Cathy|25 |
+-----+---+

垂直打印 PySpark DataFrame 行

要在单独的行中打印每个列值:

df.show(vertical=True)



-RECORD 0-----
 name | Alex  
 age  | 15    
-RECORD 1-----
 name | Bob   
 age  | 20    
-RECORD 2-----
 name | Cathy 
 age  | 25

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 PySpark DataFrame | show method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。