当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python SciPy stats.pointbiserialr用法及代码示例


本文简要介绍 python 语言中 scipy.stats.pointbiserialr 的用法。

用法:

scipy.stats.pointbiserialr(x, y)#

计算点双列相关系数及其 p 值。

点双序列相关用于测量二元变量 x 和连续变量 y 之间的关系。与其他相关系数一样,这个系数在 -1 和 +1 之间变化,0 表示没有相关性。 -1 或 +1 的相关性意味着确定性关系。

该函数可以使用快捷公式计算,但产生与 pearsonr 相同的结果。

参数

x 数组 布尔值

输入数组。

y array_like

输入数组。

返回

资源:SignificanceResult

包含属性的对象:

统计 浮点数

R 值。

p值 浮点数

两侧 p 值。

注意

pointbiserialr 使用具有 n-1 自由度的 t-test。它相当于 pearsonr

point-biserial 相关性的值可以通过以下公式计算:

其中 分别是编码为 0 和 1 的度量观测值的平均值; 分别是编码为 0 和 1 的观察数; 是观察总数, 是所有度量观察的标准差。

的值与零显著不同完全等同于两组之间的均值显著差异。因此,可以使用具有 自由度的独立组 t Test 来测试 是否为非零。用于比较两个独立组的 t-statistic 与 之间的关系由下式给出:

参考

[1]

J. Lev,“点双列相关系数”,Ann。数学。统计学家,卷。 20,第 1 期,第 125-126 页,1949 年。

[2]

射频泰特,“离散变量和连续变量之间的相关性。 Point-Biserial 相关性。”,安。数学。统计学家,卷。 25,NP。 3,第 603-607 页,1954 年。

[3]

D. Kornbrot “Point Biserial Correlation”,在 Wiley StatsRef:在线统计参考(编辑 N. Balakrishnan 等人),2014 年。DOI:10.1002/9781118445112.stat06227

例子

>>> import numpy as np
>>> from scipy import stats
>>> a = np.array([0, 0, 0, 1, 1, 1, 1])
>>> b = np.arange(7)
>>> stats.pointbiserialr(a, b)
(0.8660254037844386, 0.011724811003954652)
>>> stats.pearsonr(a, b)
(0.86602540378443871, 0.011724811003954626)
>>> np.corrcoef(a, b)
array([[ 1.       ,  0.8660254],
       [ 0.8660254,  1.       ]])

相关用法


注:本文由纯净天空筛选整理自scipy.org大神的英文原创作品 scipy.stats.pointbiserialr。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。