當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


R SparkR corr用法及代碼示例


說明:

計算兩列的 Pearson 相關係數。

用法:

corr(x, ...)

## S4 method for signature 'Column'
corr(x, col2)

## S4 method for signature 'SparkDataFrame'
corr(x, colName1, colName2, method = "pearson")

參數:

  • x 列或 SparkDataFrame。
  • ... 附加參數。如果x 是列,則應提供列。如果x 是 SparkDataFrame,則應提供兩個列名。
  • col2 (第二)列。
  • colName1 第一列的名稱
  • colName2 第二列的名稱
  • method 可選的。指定計算相關性的方法的字符。現在隻允許"pearson"。

返回:

皮爾遜相關係數作為雙倍。

注意:

自 1.6.0 起更正

自 1.6.0 起更正

例子:

df <- createDataFrame(cbind(model = rownames(mtcars), mtcars))
head(select(df, corr(df$mpg, df$hp)))


 
corr(df, "mpg", "hp")
corr(df, "mpg", "hp", method = "pearson")

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 corr。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。