本文简要介绍
pyspark.sql.DataFrame.explain
的用法。用法:
DataFrame.explain(extended=None, mode=None)
将(逻辑和物理)计划打印到控制台以进行调试。
版本 1.3.0 中的新函数。
- extended:布尔型,可选
默认
False
。如果False
,仅打印物理计划。当这是一个没有指定mode
的字符串时,它按照指定的模式工作。- mode:str,可选
指定计划的预期输出格式。
simple
:仅打印物理计划。extended
:打印逻辑和物理计划。codegen
:打印物理计划和生成的代码(如果可用)。cost
:如果可用,则打印逻辑计划和统计信息。formatted
:将解释输出分成两部分:物理计划大纲和节点详细信息。
在 3.0.0 版中更改:添加了可选参数
mode
指定计划的预期输出格式。
参数:
例子:
>>> df.explain() == Physical Plan == *(1) Scan ExistingRDD[age#0,name#1]
>>> df.explain(True) == Parsed Logical Plan == ... == Analyzed Logical Plan == ... == Optimized Logical Plan == ... == Physical Plan == ...
>>> df.explain(mode="formatted") == Physical Plan == * Scan ExistingRDD (1) (1) Scan ExistingRDD [codegen id : 1] Output [2]: [age#0, name#1] ...
>>> df.explain("cost") == Optimized Logical Plan == ...Statistics... ...
相关用法
- Python pyspark DataFrame.explode用法及代码示例
- Python pyspark DataFrame.exceptAll用法及代码示例
- Python pyspark DataFrame.eval用法及代码示例
- Python pyspark DataFrame.empty用法及代码示例
- Python pyspark DataFrame.eq用法及代码示例
- Python pyspark DataFrame.equals用法及代码示例
- Python pyspark DataFrame.to_latex用法及代码示例
- Python pyspark DataFrame.align用法及代码示例
- Python pyspark DataFrame.plot.bar用法及代码示例
- Python pyspark DataFrame.to_delta用法及代码示例
- Python pyspark DataFrame.quantile用法及代码示例
- Python pyspark DataFrame.cumsum用法及代码示例
- Python pyspark DataFrame.iloc用法及代码示例
- Python pyspark DataFrame.dropDuplicates用法及代码示例
- Python pyspark DataFrame.printSchema用法及代码示例
- Python pyspark DataFrame.to_table用法及代码示例
- Python pyspark DataFrame.rmod用法及代码示例
- Python pyspark DataFrame.div用法及代码示例
- Python pyspark DataFrame.drop_duplicates用法及代码示例
- Python pyspark DataFrame.to_pandas用法及代码示例
- Python pyspark DataFrame.sum用法及代码示例
- Python pyspark DataFrame.transform用法及代码示例
- Python pyspark DataFrame.get用法及代码示例
- Python pyspark DataFrame.rsub用法及代码示例
- Python pyspark DataFrame.pandas_on_spark.apply_batch用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.DataFrame.explain。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。