当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R SparkR corr用法及代码示例


说明:

计算两列的 Pearson 相关系数。

用法:

corr(x, ...)

## S4 method for signature 'Column'
corr(x, col2)

## S4 method for signature 'SparkDataFrame'
corr(x, colName1, colName2, method = "pearson")

参数:

  • x 列或 SparkDataFrame。
  • ... 附加参数。如果x 是列,则应提供列。如果x 是 SparkDataFrame,则应提供两个列名。
  • col2 (第二)列。
  • colName1 第一列的名称
  • colName2 第二列的名称
  • method 可选的。指定计算相关性的方法的字符。现在只允许"pearson"。

返回:

皮尔逊相关系数作为双倍。

注意:

自 1.6.0 起更正

自 1.6.0 起更正

例子:

df <- createDataFrame(cbind(model = rownames(mtcars), mtcars))
head(select(df, corr(df$mpg, df$hp)))


 
corr(df, "mpg", "hp")
corr(df, "mpg", "hp", method = "pearson")

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 corr。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。