當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python SciPy stats.pointbiserialr用法及代碼示例


本文簡要介紹 python 語言中 scipy.stats.pointbiserialr 的用法。

用法:

scipy.stats.pointbiserialr(x, y)#

計算點雙列相關係數及其 p 值。

點雙序列相關用於測量二元變量 x 和連續變量 y 之間的關係。與其他相關係數一樣,這個係數在 -1 和 +1 之間變化,0 表示沒有相關性。 -1 或 +1 的相關性意味著確定性關係。

該函數可以使用快捷公式計算,但產生與 pearsonr 相同的結果。

參數

x 數組 布爾值

輸入數組。

y array_like

輸入數組。

返回

資源:SignificanceResult

包含屬性的對象:

統計 浮點數

R 值。

p值 浮點數

兩側 p 值。

注意

pointbiserialr 使用具有 n-1 自由度的 t-test。它相當於 pearsonr

point-biserial 相關性的值可以通過以下公式計算:

其中 分別是編碼為 0 和 1 的度量觀測值的平均值; 分別是編碼為 0 和 1 的觀察數; 是觀察總數, 是所有度量觀察的標準差。

的值與零顯著不同完全等同於兩組之間的均值顯著差異。因此,可以使用具有 自由度的獨立組 t Test 來測試 是否為非零。用於比較兩個獨立組的 t-statistic 與 之間的關係由下式給出:

參考

[1]

J. Lev,“點雙列相關係數”,Ann。數學。統計學家,卷。 20,第 1 期,第 125-126 頁,1949 年。

[2]

射頻泰特,“離散變量和連續變量之間的相關性。 Point-Biserial 相關性。”,安。數學。統計學家,卷。 25,NP。 3,第 603-607 頁,1954 年。

[3]

D. Kornbrot “Point Biserial Correlation”,在 Wiley StatsRef:在線統計參考(編輯 N. Balakrishnan 等人),2014 年。DOI:10.1002/9781118445112.stat06227

例子

>>> import numpy as np
>>> from scipy import stats
>>> a = np.array([0, 0, 0, 1, 1, 1, 1])
>>> b = np.arange(7)
>>> stats.pointbiserialr(a, b)
(0.8660254037844386, 0.011724811003954652)
>>> stats.pearsonr(a, b)
(0.86602540378443871, 0.011724811003954626)
>>> np.corrcoef(a, b)
array([[ 1.       ,  0.8660254],
       [ 0.8660254,  1.       ]])

相關用法


注:本文由純淨天空篩選整理自scipy.org大神的英文原創作品 scipy.stats.pointbiserialr。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。