當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark DataFrame.plot.scatter用法及代碼示例


本文簡要介紹 pyspark.pandas.DataFrame.plot.scatter 的用法。

用法:

plot.scatter(x, y, **kwds)

創建具有不同標記點大小和顏色的散點圖。

每個點的坐標由兩個 DataFrame 列定義,實心圓圈用於表示每個點。這種圖對於查看兩個變量之間的複雜相關性很有用。例如,點可以是自然 2D 坐標,如Map中的經度和緯度,或者通常是可以相互繪製的任何一對度量。

參數

xint 或 str

用作每個點的水平坐標的列名或列位置。

yint 或 str

用作每個點的垂直坐標的列名或列位置。

s標量或類似數組,可選

(僅限 matplotlib)。

cstr,int 或 數組,可選

(僅限 matplotlib)。

**kwds: Optional

要傳遞給 pyspark.pandas.DataFrame.plot() 的關鍵字參數。

返回

plotly.graph_objs.Figure

backend!=plotly 時返回自定義對象。當subplots=True(僅限 matplotlib)時返回 ndarray。

例子

讓我們看看如何使用 DataFrame 列中值的坐標繪製散點圖。

>>> df = ps.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1],
...                    [6.4, 3.2, 1], [5.9, 3.0, 2]],
...                   columns=['length', 'width', 'species'])
>>> df.plot.scatter(x='length', y='width')

現在有了黑暗方案:

>>> df = ps.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1],
...                    [6.4, 3.2, 1], [5.9, 3.0, 2]],
...                   columns=['length', 'width', 'species'])
>>> fig = df.plot.scatter(x='length', y='width')
>>> fig.update_layout(template="plotly_dark")

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.plot.scatter。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。