当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Pandas DataFrame corrwith方法用法及代码示例


Pandas DataFrame.corrwith(~) 计算源 DataFrame 的列或行与给定的 SeriesDataFrame 之间的成对相关性。

警告

corrwith(~) 将仅计算列标签或行标签对齐的列或行的相关性。否则,将返回填充NaN的列或行。

请注意,相关性的无偏估计量计算得出:

参数

1.other | SeriesDataFrame

用于计算相关性的SeriesDataFrame

2. axis | intstring | optional

是否计算行或列的相关性:

说明

0"index"

计算列之间的相关性。

1"columns"

计算行之间的相关性。

默认情况下,axis=0

3. drop | boolean | optional

是否删除源 DataFrame 和 other 中都不存在的行或列。默认情况下,drop=False

4. method | stringcallable | optional

要计算的相关系数的类型:

说明

"pearson"

计算标准相关系数。

"kendall"

计算 Kendall Tau 相关系数。

"spearman"

计算斯皮尔曼等级相关性。

callable

该函数接受两个一维 Numpy 数组作为参数并返回单个浮点数。返回的矩阵始终是对称的,并且沿主对角线填充 1。

返回值

Series 保存源 DataFrame 和 other 的列或行之间的成对相关性。

例子

基本用法

考虑以下数据帧:

df = pd.DataFrame({"A":[2,4,6], "B":[3,4,5]})
df_other = pd.DataFrame({"A":[6,2,3],"C":[1,2,3]})



   A  B  |     A  C
0  2  3  |  0  6  1
1  4  4  |  1  2  2
2  6  5  |  2  3  3

计算 dfdf_other 的相关性:

df.corrwith(df_other)



A   -0.720577
B         NaN
C         NaN
dtype: float64

请注意,如何仅计算两个 DataFrame 中存在的一对列 A 的相关性。

指定掉落

要删除不匹配的行或列标签,请设置 drop=True

df.corrwith(df_other, drop=True)



A   -0.720577
dtype: float64

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 Pandas DataFrame | corrwith method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。