PySpark DataFrame 的show(~)
方法在控制台上打印DataFrame 的行。
参数
1.n
| int
| optional
要显示的行数。默认情况下,n=20
。
2. truncate
| boolean
或 int
| optional
-
如果是
True
,则长度超过 20 个字符的字符串将被截断。 -
如果
False
,则将显示整个字符串。 -
如果是
int
,则长度超过truncate
的字符串将被截断。
如果发生截断,则保留字符串的左侧部分。默认情况下,truncate=True
。
3. vertical
| boolean
| optional
如果是 True
,则每列值打印一行。默认情况下,vertical=False
。
返回值
None
。
例子
考虑以下PySpark DataFrame:
columns = ["name", "age"]
data = [("Alex", 15), ("Bob", 20), ("Cathy", 25)]
df = spark.createDataFrame(data, columns)
打印 PySpark DataFrame 的前 n 行
要打印 PySpark DataFrame 的前 20 行:
df.show() # n=20
+-----+---+
| name|age|
+-----+---+
| Alex| 15|
| Bob| 20|
|Cathy| 25|
+-----+---+
要打印 DataFrame 的前 2 行:
df.show(n=2)
+----+---+
|name|age|
+----+---+
|Alex| 15|
| Bob| 20|
+----+---+
only showing top 2 rows
截断 PySpark DataFrame 打印行中的字符串
截断长度超过 2 的字符串:
df.show(truncate=2)
+----+---+
|name|age|
+----+---+
| Al| 15|
| Bo| 20|
| Ca| 25|
+----+---+
禁用 PySpark DataFrame 打印行中的字符串截断
要禁用打印行中字符串的截断:
df.show(truncate=False)
+-----+---+
|name |age|
+-----+---+
|Alex |15 |
|Bob |20 |
|Cathy|25 |
+-----+---+
垂直打印 PySpark DataFrame 行
要在单独的行中打印每个列值:
df.show(vertical=True)
-RECORD 0-----
name | Alex
age | 15
-RECORD 1-----
name | Bob
age | 20
-RECORD 2-----
name | Cathy
age | 25
相关用法
- Python Pandas DataFrame shift方法用法及代码示例
- Python Pandas DataFrame shape属性用法及代码示例
- Python Pandas DataFrame sample方法用法及代码示例
- Python Pandas DataFrame swaplevel方法用法及代码示例
- Python PySpark DataFrame sampleBy方法用法及代码示例
- Python Pandas DataFrame set_axis方法用法及代码示例
- Python Pandas DataFrame select_dtypes方法用法及代码示例
- Python PySpark DataFrame selectExpr方法用法及代码示例
- Python PySpark DataFrame select方法用法及代码示例
- Python Pandas DataFrame stack方法用法及代码示例
- Python Pandas DataFrame sort_index方法用法及代码示例
- Python Pandas DataFrame size属性用法及代码示例
- Python Pandas DataFrame set_index方法用法及代码示例
- Python Pandas DataFrame swapaxes方法用法及代码示例
- Python PySpark DataFrame sort方法用法及代码示例
- Python PySpark DataFrame sample方法用法及代码示例
- Python Pandas DataFrame sub方法用法及代码示例
- Python Pandas DataFrame sem方法用法及代码示例
- Python Pandas DataFrame sum方法用法及代码示例
- Python Pandas DataFrame std方法用法及代码示例
- Python PySpark DataFrame summary方法用法及代码示例
- Python Pandas DataFrame sort_values方法用法及代码示例
- Python Pandas DataFrame slice_shift方法用法及代码示例
- Python Pandas DataFrame squeeze方法用法及代码示例
- Python Pandas DataFrame empty属性用法及代码示例
注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 PySpark DataFrame | show method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。