当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark DataFrame.explain用法及代码示例


本文简要介绍 pyspark.sql.DataFrame.explain 的用法。

用法:

DataFrame.explain(extended=None, mode=None)

将(逻辑和物理)计划打印到控制台以进行调试。

版本 1.3.0 中的新函数。

参数

extended布尔型,可选

默认 False 。如果 False ,仅打印物理计划。当这是一个没有指定 mode 的字符串时,它按照指定的模式工作。

modestr,可选

指定计划的预期输出格式。

  • simple :仅打印物理计划。

  • extended:打印逻辑和物理计划。

  • codegen :打印物理计划和生成的代码(如果可用)。

  • cost :如果可用,则打印逻辑计划和统计信息。

  • formatted:将解释输出分成两部分:物理计划大纲和节点详细信息。

在 3.0.0 版中更改:添加了可选参数mode指定计划的预期输出格式。

例子

>>> df.explain()
== Physical Plan ==
*(1) Scan ExistingRDD[age#0,name#1]
>>> df.explain(True)
== Parsed Logical Plan ==
...
== Analyzed Logical Plan ==
...
== Optimized Logical Plan ==
...
== Physical Plan ==
...
>>> df.explain(mode="formatted")
== Physical Plan ==
* Scan ExistingRDD (1)
(1) Scan ExistingRDD [codegen id : 1]
Output [2]: [age#0, name#1]
...
>>> df.explain("cost")
== Optimized Logical Plan ==
...Statistics...
...

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.DataFrame.explain。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。