当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R SparkR histogram用法及代码示例


说明:

此函数计算给定 SparkR 列的直方图。

用法:

## S4 method for signature 'SparkDataFrame,characterOrColumn'
histogram(df, col, nbins = 10)

参数:

  • df SparkDataFrame 包含要从中构建直方图的 Column。
  • col 列作为字符串或用于构建直方图的列。
  • nbins 箱子的数量(可选)。默认值为 10。

返回:

具有直方图统计信息的 data.frame,即计数和质心。

注意:

自 2.0.0 以来的直方图

例子:

# Create a SparkDataFrame from the Iris dataset
irisDF <- createDataFrame(iris)

# Compute histogram statistics
histStats <- histogram(irisDF, irisDF$Sepal_Length, nbins = 12)

# Once SparkR has computed the histogram statistics, the histogram can be
# rendered using the ggplot2 library:

require(ggplot2)
plot <- ggplot(histStats, aes(x = centroids, y = counts)) +
        geom_bar(stat = "identity") +
        xlab("Sepal_Length") + ylab("Frequency")

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 Compute histogram statistics for given column。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。