當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python dask.dataframe.groupby.DataFrameGroupBy.corr用法及代碼示例


用法:

DataFrameGroupBy.corr(ddof=1, split_every=None, split_out=1)

計算列的成對相關性,不包括 NA/null 值。

此文檔字符串是從 pandas.core.frame.DataFrame.corr 複製而來的。

可能存在與 Dask 版本的一些不一致之處。

分組相關:corr(X, Y) = cov(X, Y) /(std_x * std_y)

參數

method{‘pearson’, ‘kendall’, ‘spearman’} 或可調用(Dask 中不支持)

相關方法:

  • 皮爾遜:標準相關係數
  • kendall:Kendall Tau 相關係數
  • spearman:Spearman 等級相關性
  • 可調用:可通過輸入兩個 1d ndarray 調用

    並返回一個浮點數。請注意,從 corr 返回的矩陣沿對角線將具有 1 並且無論可調用對象的行為如何都是對稱的。

min_periodsint,可選(在 Dask 中不支持)

每對列所需的最小觀察次數以獲得有效結果。目前僅適用於 Pearson 和 Spearman 相關。

返回

DataFrame

相關矩陣。

例子

>>> def histogram_intersection(a, b):  
...     v = np.minimum(a, b).sum().round(decimals=1)
...     return v
>>> df = pd.DataFrame([(.2, .3), (.0, .6), (.6, .0), (.2, .1)],  
...                   columns=['dogs', 'cats'])
>>> df.corr(method=histogram_intersection)  
      dogs  cats
dogs   1.0   0.3
cats   0.3   1.0

相關用法


注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.dataframe.groupby.DataFrameGroupBy.corr。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。