当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark DataFrame.plot.scatter用法及代码示例


本文简要介绍 pyspark.pandas.DataFrame.plot.scatter 的用法。

用法:

plot.scatter(x, y, **kwds)

创建具有不同标记点大小和颜色的散点图。

每个点的坐标由两个 DataFrame 列定义,实心圆圈用于表示每个点。这种图对于查看两个变量之间的复杂相关性很有用。例如,点可以是自然 2D 坐标,如Map中的经度和纬度,或者通常是可以相互绘制的任何一对度量。

参数

xint 或 str

用作每个点的水平坐标的列名或列位置。

yint 或 str

用作每个点的垂直坐标的列名或列位置。

s标量或类似数组,可选

(仅限 matplotlib)。

cstr,int 或 数组,可选

(仅限 matplotlib)。

**kwds: Optional

要传递给 pyspark.pandas.DataFrame.plot() 的关键字参数。

返回

plotly.graph_objs.Figure

backend!=plotly 时返回自定义对象。当subplots=True(仅限 matplotlib)时返回 ndarray。

例子

让我们看看如何使用 DataFrame 列中值的坐标绘制散点图。

>>> df = ps.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1],
...                    [6.4, 3.2, 1], [5.9, 3.0, 2]],
...                   columns=['length', 'width', 'species'])
>>> df.plot.scatter(x='length', y='width')

现在有了黑暗方案:

>>> df = ps.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1],
...                    [6.4, 3.2, 1], [5.9, 3.0, 2]],
...                   columns=['length', 'width', 'species'])
>>> fig = df.plot.scatter(x='length', y='width')
>>> fig.update_layout(template="plotly_dark")

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.plot.scatter。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。