當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark Series.hist用法及代碼示例


本文簡要介紹 pyspark.pandas.Series.hist 的用法。

用法:

Series.hist(bins=10, **kwds)

繪製一個 DataFrame 列的直方圖。 histogram 是數據分布的表示形式。此函數在 DataFrame 中的每個係列上調用 plotting.backend.plot() ,從而每列生成一個直方圖。

參數

bins整數或序列,默認 10

要使用的直方圖箱數。如果給定一個整數,則計算並返回 bin + 1 個 bin 邊。如果 bins 是一個序列,則給出 bin 邊,包括第一個 bin 的左邊和最後一個 bin 的右邊。在這種情況下,bins 未經修改返回。

**kwds

要傳遞給繪圖後端的所有其他繪圖關鍵字參數。

返回

plotly.graph_objs.Figure

backend!=plotly 時返回一個自定義對象。當 subplots=True (matplotlib-only) 時返回一個 ndarray。

例子

基本情節。

對於係列:

>>> s = ps.Series([1, 3, 2])
>>> s.plot.hist()

對於 DataFrame :

>>> df = pd.DataFrame(
...     np.random.randint(1, 7, 6000),
...     columns=['one'])
>>> df['two'] = df['one'] + np.random.randint(1, 7, 6000)
>>> df = ps.from_pandas(df)
>>> df.plot.hist(bins=12, alpha=0.5)

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.hist。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。