Python Pandas DataFrame corrwith方法用法及代码示例

Pandas DataFrame.corrwith(~) 计算源 DataFrame 的列或行与给定的 Series 或 DataFrame 之间的成对相关性。

警告

corrwith(~) 将仅计算列标签或行标签对齐的列或行的相关性。否则，将返回填充NaN的列或行。

请注意，相关性的无偏估计量计算得出：

参数

1.other | Series 或 DataFrame

用于计算相关性的Series 或DataFrame。

2. axis | int 或 string | optional

是否计算行或列的相关性：

轴	说明
`0` 或 `"index"`	计算列之间的相关性。
`1` 或 `"columns"`	计算行之间的相关性。

默认情况下，axis=0 。

3. drop | boolean | optional

是否删除源 DataFrame 和 other 中都不存在的行或列。默认情况下，drop=False 。

4. method | string 或 callable | optional

要计算的相关系数的类型：

值	说明
`"pearson"`	计算标准相关系数。
`"kendall"`	计算 Kendall Tau 相关系数。
`"spearman"`	计算斯皮尔曼等级相关性。
`callable`	该函数接受两个一维 Numpy 数组作为参数并返回单个浮点数。返回的矩阵始终是对称的，并且沿主对角线填充 1。

返回值

Series 保存源 DataFrame 和 other 的列或行之间的成对相关性。

例子

基本用法

考虑以下数据帧：

df = pd.DataFrame({"A":[2,4,6], "B":[3,4,5]})
df_other = pd.DataFrame({"A":[6,2,3],"C":[1,2,3]})



   A  B  |     A  C
0  2  3  |  0  6  1
1  4  4  |  1  2  2
2  6  5  |  2  3  3

计算 df 和 df_other 的相关性：

df.corrwith(df_other)



A   -0.720577
B         NaN
C         NaN
dtype: float64

请注意，如何仅计算两个 DataFrame 中存在的一对列 A 的相关性。

指定掉落

要删除不匹配的行或列标签，请设置 drop=True ：

df.corrwith(df_other, drop=True)



A   -0.720577
dtype: float64

相关用法

注：本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 Pandas DataFrame | corrwith method。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。