Pandas DataFrame.cov(~)方法計算源 DataFrame 中列的協方差矩陣。請注意,協方差的無偏估計量用來:
其中,
- 
是列中值的數量 
- 
是 列的樣本平均值 
- 
是 列的樣本平均值 
- 
和分別是和列中的第值。 
注意
所有 NaN 值都將被忽略。
參數
1.min_periods | int | optional
計算協方差的非 NaN 值的最小數量。
返回值
DataFrame 表示源 DataFrame 中值的協方差矩陣。
例子
基本用法
考慮以下 DataFrame :
df = pd.DataFrame({"A":[2,4,6],"B":[3,4,5]})
df
   A  B
0  2  3
1  4  4
2  6  5要計算兩列的協方差:
df.cov()
   A    B
A  4.0  2.0
B  2.0  1.0在這裏,我們得到以下結果:
- 
列 A和B的樣本協方差為2.0。
- 
A列的樣本方差為4.0,B列的樣本方差為1.0。
指定min_periods
考慮以下帶有一些缺失值的DataFrame:
df = pd.DataFrame({"A":[3,np.NaN,4],"B":[5,6,7]})
df
   A    B
0  3.0  5.0
1  NaN  6.0
2  4.0  7.0設置 min_periods=3 會產生:
df.cov(min_periods=3)
   A    B
A  NaN  NaN
B  NaN  1.0在這裏,我們得到 NaN 的原因是,由於該方法忽略了 NaN ,因此 A 列隻有 2 個值。由於我們已將計算協方差的最小閾值設置為 3 ,因此我們最終得到一個由 NaN 填充的 DataFrame 。
相關用法
- Python PySpark DataFrame cov方法用法及代碼示例
- Python Pandas DataFrame copy方法用法及代碼示例
- Python PySpark DataFrame collect方法用法及代碼示例
- Python PySpark DataFrame coalesce方法用法及代碼示例
- Python Pandas DataFrame corrwith方法用法及代碼示例
- Python PySpark DataFrame corr方法用法及代碼示例
- Python Pandas DataFrame convert_dtypes方法用法及代碼示例
- Python Pandas DataFrame combine方法用法及代碼示例
- Python Pandas DataFrame columns屬性用法及代碼示例
- Python Pandas DataFrame count方法用法及代碼示例
- Python PySpark DataFrame colRegex方法用法及代碼示例
- Python PySpark DataFrame columns屬性用法及代碼示例
- Python PySpark DataFrame count方法用法及代碼示例
- Python Pandas DataFrame corr方法用法及代碼示例
- Python Pandas DataFrame combine_first方法用法及代碼示例
- Python Pandas DataFrame clip方法用法及代碼示例
- Python Pandas DataFrame cummax方法用法及代碼示例
- Python Pandas DataFrame cumprod方法用法及代碼示例
- Python Pandas DataFrame cummin方法用法及代碼示例
- Python Pandas DataFrame cumsum方法用法及代碼示例
- Python Pandas DataFrame empty屬性用法及代碼示例
- Python Pandas DataFrame pop方法用法及代碼示例
- Python Pandas DataFrame nsmallest方法用法及代碼示例
- Python Pandas DataFrame sample方法用法及代碼示例
- Python Pandas DataFrame items方法用法及代碼示例
注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 Pandas DataFrame | cov method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。
