當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python PySpark DataFrame cov方法用法及代碼示例


PySpark DataFrame 的 cov(~) 方法以浮點形式返回兩個指定數字列的協方差。

參數

1. col1 | string

第一欄。

2. col2 | string

第二欄。

返回值

一個float

例子

考慮以下PySpark DataFrame:

df = spark.createDataFrame([("Alex", 180, 80), ("Bob", 170, 70), ("Cathy", 160, 70)], ["name", "height", "weight"])
df.show()



+-----+------+------+
| name|height|weight|
+-----+------+------+
| Alex|   180|    80|
|  Bob|   170|    70|
|Cathy|   160|    70|
+-----+------+------+

計算兩個數字 PySpark 列的協方差

要計算 heightweight 列之間的協方差:

df.cov("height","weight")



50.0

在這裏,我們看到heightweight 之間的協方差是50(正相關)。

相關用法


注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 PySpark DataFrame | cov method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。