当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark DataFrame.hist用法及代码示例


本文简要介绍 pyspark.pandas.DataFrame.hist 的用法。

用法:

DataFrame.hist(bins=10, **kwds)

绘制一个 DataFrame 列的直方图。 histogram 是数据分布的表示形式。此函数在 DataFrame 中的每个系列上调用 plotting.backend.plot() ,从而每列生成一个直方图。

参数

bins整数或序列,默认 10

要使用的直方图箱数。如果给定一个整数,则计算并返回 bin + 1 个 bin 边。如果 bins 是一个序列,则给出 bin 边,包括第一个 bin 的左边和最后一个 bin 的右边。在这种情况下,bins 未经修改返回。

**kwds

要传递给绘图后端的所有其他绘图关键字参数。

返回

plotly.graph_objs.Figure

backend!=plotly 时返回自定义对象。当subplots=True(仅限 matplotlib)时返回 ndarray。

例子

基本情节。

对于系列:

>>> s = ps.Series([1, 3, 2])
>>> s.plot.hist()

对于 DataFrame :

>>> df = pd.DataFrame(
...     np.random.randint(1, 7, 6000),
...     columns=['one'])
>>> df['two'] = df['one'] + np.random.randint(1, 7, 6000)
>>> df = ps.from_pandas(df)
>>> df.plot.hist(bins=12, alpha=0.5)

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.hist。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。