當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark DataFrame.plot.bar用法及代碼示例


本文簡要介紹 pyspark.pandas.DataFrame.plot.bar 的用法。

用法:

plot.bar(x=None, y=None, **kwds)

垂直條形圖。

參數

x標簽或位置,可選

允許繪製一列與另一列的圖。如果未指定,則使用 DataFrame 的索引。

y標簽或位置,可選

允許繪製一列與另一列。如果未指定,則使用所有數字列。

**kwds可選的

其他關鍵字參數記錄在 pyspark.pandas.Series.plot() pyspark.pandas.DataFrame.plot() 中。

返回

plotly.graph_objs.Figure

backend!=plotly 時返回自定義對象。當subplots=True(僅限 matplotlib)時返回 ndarray。

例子

基本情節。

對於係列:

>>> s = ps.Series([1, 3, 2])
>>> s.plot.bar()

對於 DataFrame :

>>> df = ps.DataFrame({'lab': ['A', 'B', 'C'], 'val': [10, 30, 20]})
>>> df.plot.bar(x='lab', y='val')

將整個 DataFrame 繪製成條形圖。每列沿水平軸以不同的顏色堆疊。

>>> speed = [0.1, 17.5, 40, 48, 52, 69, 88]
>>> lifespan = [2, 8, 70, 1.5, 25, 12, 28]
>>> index = ['snail', 'pig', 'elephant',
...          'rabbit', 'giraffe', 'coyote', 'horse']
>>> df = ps.DataFrame({'speed': speed,
...                    'lifespan': lifespan}, index=index)
>>> df.plot.bar()

可以使用 plotly API 按列拆分圖形,而不是堆疊。

>>> from plotly.subplots import make_subplots
>>> speed = [0.1, 17.5, 40, 48, 52, 69, 88]
>>> lifespan = [2, 8, 70, 1.5, 25, 12, 28]
>>> index = ['snail', 'pig', 'elephant',
...          'rabbit', 'giraffe', 'coyote', 'horse']
>>> df = ps.DataFrame({'speed': speed,
...                    'lifespan': lifespan}, index=index)
>>> fig = (make_subplots(rows=2, cols=1)
...        .add_trace(df.plot.bar(y='speed').data[0], row=1, col=1)
...        .add_trace(df.plot.bar(y='speed').data[0], row=1, col=1)
...        .add_trace(df.plot.bar(y='lifespan').data[0], row=2, col=1))
>>> fig

繪製單個列。

>>> speed = [0.1, 17.5, 40, 48, 52, 69, 88]
>>> lifespan = [2, 8, 70, 1.5, 25, 12, 28]
>>> index = ['snail', 'pig', 'elephant',
...          'rabbit', 'giraffe', 'coyote', 'horse']
>>> df = ps.DataFrame({'speed': speed,
...                    'lifespan': lifespan}, index=index)
>>> df.plot.bar(y='speed')

僅繪製 DataFrame 的選定類別。

>>> speed = [0.1, 17.5, 40, 48, 52, 69, 88]
>>> lifespan = [2, 8, 70, 1.5, 25, 12, 28]
>>> index = ['snail', 'pig', 'elephant',
...          'rabbit', 'giraffe', 'coyote', 'horse']
>>> df = ps.DataFrame({'speed': speed,
...                    'lifespan': lifespan}, index=index)
>>> df.plot.bar(x='lifespan')

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.plot.bar。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。