当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cudf.core.groupby.groupby.GroupBy.corr用法及代码示例


用法:

GroupBy.corr(method='pearson', min_periods=1)

计算列的成对相关性,不包括 NA/null 值。

参数

method: {“pearson”, “kendall”, “spearman”} or callable,

默认“pearson”。目前仅支持 pearson 相关系数。

min_periods: int, optional

每对列所需的最小观察次数以获得有效结果。

返回

DataFrame

相关矩阵。

例子

>>> import cudf
>>> gdf = cudf.DataFrame({
...             "id": ["a", "a", "a", "b", "b", "b", "c", "c", "c"],
...             "val1": [5, 4, 6, 4, 8, 7, 4, 5, 2],
...             "val2": [4, 5, 6, 1, 2, 9, 8, 5, 1],
...             "val3": [4, 5, 6, 1, 2, 9, 8, 5, 1]})
>>> gdf
id  val1  val2  val3
0  a     5     4     4
1  a     4     5     5
2  a     6     6     6
3  b     4     1     1
4  b     8     2     2
5  b     7     9     9
6  c     4     8     8
7  c     5     5     5
8  c     2     1     1
>>> gdf.groupby("id").corr(method="pearson")
            val1      val2      val3
id
a   val1  1.000000  0.500000  0.500000
    val2  0.500000  1.000000  1.000000
    val3  0.500000  1.000000  1.000000
b   val1  1.000000  0.385727  0.385727
    val2  0.385727  1.000000  1.000000
    val3  0.385727  1.000000  1.000000
c   val1  1.000000  0.714575  0.714575
    val2  0.714575  1.000000  1.000000
    val3  0.714575  1.000000  1.000000

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.core.groupby.groupby.GroupBy.corr。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。