本文简要介绍
pyspark.pandas.DataFrame.hist
的用法。用法:
DataFrame.hist(bins=10, **kwds)
绘制一个 DataFrame 列的直方图。 histogram 是数据分布的表示形式。此函数在 DataFrame 中的每个系列上调用
plotting.backend.plot()
,从而每列生成一个直方图。- bins:整数或序列,默认 10
要使用的直方图箱数。如果给定一个整数,则计算并返回 bin + 1 个 bin 边。如果 bins 是一个序列,则给出 bin 边,包括第一个 bin 的左边和最后一个 bin 的右边。在这种情况下,bins 未经修改返回。
- **kwds:
要传递给绘图后端的所有其他绘图关键字参数。
plotly.graph_objs.Figure
当
backend!=plotly
时返回自定义对象。当subplots=True
(仅限 matplotlib)时返回 ndarray。
参数:
返回:
例子:
基本情节。
对于系列:
>>> s = ps.Series([1, 3, 2]) >>> s.plot.hist()
对于 DataFrame :
>>> df = pd.DataFrame( ... np.random.randint(1, 7, 6000), ... columns=['one']) >>> df['two'] = df['one'] + np.random.randint(1, 7, 6000) >>> df = ps.from_pandas(df) >>> df.plot.hist(bins=12, alpha=0.5)
相关用法
- Python pyspark DataFrame.hint用法及代码示例
- Python pyspark DataFrame.head用法及代码示例
- Python pyspark DataFrame.to_latex用法及代码示例
- Python pyspark DataFrame.align用法及代码示例
- Python pyspark DataFrame.plot.bar用法及代码示例
- Python pyspark DataFrame.to_delta用法及代码示例
- Python pyspark DataFrame.quantile用法及代码示例
- Python pyspark DataFrame.cumsum用法及代码示例
- Python pyspark DataFrame.iloc用法及代码示例
- Python pyspark DataFrame.dropDuplicates用法及代码示例
- Python pyspark DataFrame.printSchema用法及代码示例
- Python pyspark DataFrame.to_table用法及代码示例
- Python pyspark DataFrame.rmod用法及代码示例
- Python pyspark DataFrame.div用法及代码示例
- Python pyspark DataFrame.drop_duplicates用法及代码示例
- Python pyspark DataFrame.to_pandas用法及代码示例
- Python pyspark DataFrame.sum用法及代码示例
- Python pyspark DataFrame.transform用法及代码示例
- Python pyspark DataFrame.get用法及代码示例
- Python pyspark DataFrame.rsub用法及代码示例
- Python pyspark DataFrame.pandas_on_spark.apply_batch用法及代码示例
- Python pyspark DataFrame.groupBy用法及代码示例
- Python pyspark DataFrame.copy用法及代码示例
- Python pyspark DataFrame.values用法及代码示例
- Python pyspark DataFrame.reindex_like用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.hist。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。