当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Series.plot.box用法及代码示例


本文简要介绍 pyspark.pandas.Series.plot.box 的用法。

用法:

plot.box(**kwds)

制作系列列的箱线图。

参数

**kwds可选的

其他关键字参数记录在 pyspark.pandas.Series.plot() 中。

precision: scalar, default = 0.01

pandas-on-Spark 使用此参数来计算构建箱线图的近似统计数据。使用较小的值来获得更精确的统计信息 (matplotlib-only)。

返回

plotly.graph_objs.Figure

backend!=plotly 时返回一个自定义对象。当 subplots=True (matplotlib-only) 时返回一个 ndarray。

注意

pandas-on-Spark 和 pandas 之间存在行为差异。

  • pandas-on-Spark 计算近似统计数据 - 预计 pandas 和 pandas-on-Spark 箱线图之间的差异,尤其是在第一和第三四分位数方面。

  • whis 参数仅支持作为单个数字。

  • pandas-on-Spark 不支持以下参数 (matplotlib-only)。

    • bootstrap 参数不受支持

    • autorange 参数不受支持

例子

从 DataFrame 中绘制一个箱线图,其中包含四列随机生成的数据。

对于系列:

>>> data = np.random.randn(25, 4)
>>> df = ps.DataFrame(data, columns=list('ABCD'))
>>> df['A'].plot.box()

DataFrame 类型不支持此函数

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.plot.box。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。