當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python Pandas DataFrame corrwith方法用法及代碼示例


Pandas DataFrame.corrwith(~) 計算源 DataFrame 的列或行與給定的 SeriesDataFrame 之間的成對相關性。

警告

corrwith(~) 將僅計算列標簽或行標簽對齊的列或行的相關性。否則,將返回填充NaN的列或行。

請注意,相關性的無偏估計量計算得出:

參數

1.other | SeriesDataFrame

用於計算相關性的SeriesDataFrame

2. axis | intstring | optional

是否計算行或列的相關性:

說明

0"index"

計算列之間的相關性。

1"columns"

計算行之間的相關性。

默認情況下,axis=0

3. drop | boolean | optional

是否刪除源 DataFrame 和 other 中都不存在的行或列。默認情況下,drop=False

4. method | stringcallable | optional

要計算的相關係數的類型:

說明

"pearson"

計算標準相關係數。

"kendall"

計算 Kendall Tau 相關係數。

"spearman"

計算斯皮爾曼等級相關性。

callable

該函數接受兩個一維 Numpy 數組作為參數並返回單個浮點數。返回的矩陣始終是對稱的,並且沿主對角線填充 1。

返回值

Series 保存源 DataFrame 和 other 的列或行之間的成對相關性。

例子

基本用法

考慮以下數據幀:

df = pd.DataFrame({"A":[2,4,6], "B":[3,4,5]})
df_other = pd.DataFrame({"A":[6,2,3],"C":[1,2,3]})



   A  B  |     A  C
0  2  3  |  0  6  1
1  4  4  |  1  2  2
2  6  5  |  2  3  3

計算 dfdf_other 的相關性:

df.corrwith(df_other)



A   -0.720577
B         NaN
C         NaN
dtype: float64

請注意,如何僅計算兩個 DataFrame 中存在的一對列 A 的相關性。

指定掉落

要刪除不匹配的行或列標簽,請設置 drop=True

df.corrwith(df_other, drop=True)



A   -0.720577
dtype: float64

相關用法


注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 Pandas DataFrame | corrwith method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。