当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.dataframe.groupby.DataFrameGroupBy.corr用法及代码示例


用法:

DataFrameGroupBy.corr(ddof=1, split_every=None, split_out=1)

计算列的成对相关性,不包括 NA/null 值。

此文档字符串是从 pandas.core.frame.DataFrame.corr 复制而来的。

可能存在与 Dask 版本的一些不一致之处。

分组相关:corr(X, Y) = cov(X, Y) /(std_x * std_y)

参数

method{‘pearson’, ‘kendall’, ‘spearman’} 或可调用(Dask 中不支持)

相关方法:

  • 皮尔逊:标准相关系数
  • kendall:Kendall Tau 相关系数
  • spearman:Spearman 等级相关性
  • 可调用:可通过输入两个 1d ndarray 调用

    并返回一个浮点数。请注意,从 corr 返回的矩阵沿对角线将具有 1 并且无论可调用对象的行为如何都是对称的。

min_periodsint,可选(在 Dask 中不支持)

每对列所需的最小观察次数以获得有效结果。目前仅适用于 Pearson 和 Spearman 相关。

返回

DataFrame

相关矩阵。

例子

>>> def histogram_intersection(a, b):  
...     v = np.minimum(a, b).sum().round(decimals=1)
...     return v
>>> df = pd.DataFrame([(.2, .3), (.0, .6), (.6, .0), (.2, .1)],  
...                   columns=['dogs', 'cats'])
>>> df.corr(method=histogram_intersection)  
      dogs  cats
dogs   1.0   0.3
cats   0.3   1.0

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.dataframe.groupby.DataFrameGroupBy.corr。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。