Python pyspark DataFrame.hist用法及代码示例

本文简要介绍 pyspark.pandas.DataFrame.hist 的用法。

用法:
DataFrame.hist(bins=10, **kwds)

绘制一个 DataFrame 列的直方图。 histogram 是数据分布的表示形式。此函数在 DataFrame 中的每个系列上调用 plotting.backend.plot() ，从而每列生成一个直方图。

参数：

bins：整数或序列，默认 10: 要使用的直方图箱数。如果给定一个整数，则计算并返回 bin + 1 个 bin 边。如果 bins 是一个序列，则给出 bin 边，包括第一个 bin 的左边和最后一个 bin 的右边。在这种情况下，bins 未经修改返回。
**kwds：: 要传递给绘图后端的所有其他绘图关键字参数。

plotly.graph_objs.Figure: 当 backend!=plotly 时返回自定义对象。当subplots=True(仅限 matplotlib)时返回 ndarray。

例子：

基本情节。

对于系列：

>>> s = ps.Series([1, 3, 2])
>>> s.plot.hist()

对于 DataFrame ：

>>> df = pd.DataFrame(
...     np.random.randint(1, 7, 6000),
...     columns=['one'])
>>> df['two'] = df['one'] + np.random.randint(1, 7, 6000)
>>> df = ps.from_pandas(df)
>>> df.plot.hist(bins=12, alpha=0.5)

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.hist。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

参数：

返回：

例子：