当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.array.stats.skew用法及代码示例


用法:

dask.array.stats.skew(a, axis=0, bias=True, nan_policy='propagate')

计算数据集的样本偏度。

此文档字符串是从 scipy.stats.skew 复制的。

可能存在与 Dask 版本的一些不一致之处。

对于正态分布的数据,偏度应该大约为零。对于单峰连续分布,偏度值大于零意味着分布的右尾有更多权重。从统计学上讲,函数skewtest 可用于确定偏度值是否足够接近零。

参数

andarray

输入数组。

axisint 或无,可选

计算偏度的轴。默认值为 0。如果没有,则计算整个数组 a

bias布尔型,可选

如果为 False,则针对统计偏差校正计算。

nan_policy{‘propagate’, ‘raise’, ‘omit’},可选

定义当输入包含 nan 时如何处理。以下选项可用(默认为‘propagate’):

  • ‘propagate’:返回 nan

  • ‘raise’:引发错误

  • ‘omit’:执行忽略 nan 值的计算

返回

skewnessndarray

沿轴的值的偏度,在所有值都相等的情况下返回 0。

注意

样本偏度计算为 Fisher-Pearson 偏度系数,即

其中

是有偏样本 中心矩, 是样本均值。如果 bias 为 False,则对计算进行偏差校正,计算的值是调整后的 Fisher-Pearson 标准化力矩系数,即

参考

1

Zwillinger, D. 和 Kokoska, S. (2000)。 CRC 标准概率和统计表和公式。查普曼和霍尔:纽约。 2000. 第 2.2.24.1 节

例子

>>> from scipy.stats import skew  
>>> skew([1, 2, 3, 4, 5])  
0.0
>>> skew([2, 8, 0, 4, 1, 9, 9, 0])  
0.2650554122698573

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.array.stats.skew。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。