当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python SciPy stats.skew用法及代码示例


本文简要介绍 python 语言中 scipy.stats.skew 的用法。

用法:

scipy.stats.skew(a, axis=0, bias=True, nan_policy='propagate', *, keepdims=False)#

计算数据集的样本偏度。

对于正态分布的数据,偏度应该大约为零。对于单峰连续分布,偏度值大于零意味着分布的右尾有更多权重。从统计上讲,函数 skewtest 可用于确定偏度值是否足够接近零。

参数

a ndarray

输入数组。

axis int 或无,默认值:0

如果是 int,则计算统计量的输入轴。输入的每个axis-slice(例如行)的统计信息将出现在输出的相应元素中。如果 None ,输入将在计算统计数据之前被分解。

bias 布尔型,可选

如果为 False,则针对统计偏差校正计算。

nan_policy {‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入 NaN。

  • propagate :如果计算统计数据的轴切片(例如行)中存在NaN,则输出的相应条目将为 NaN。

  • omit : 计算时将省略NaNs。如果计算统计数据的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。

  • raise :如果存在 NaN,则会引发 ValueError

keepdims 布尔值,默认值:假

如果将其设置为 True,则缩小的轴将作为尺寸为 1 的尺寸留在结果中。使用此选项,结果将针对输入数组正确广播。

返回

skewness ndarray

值沿轴的偏度,返回NaN,其中所有值都相等。

注意

样本偏度计算为 Fisher-Pearson 偏度系数,即

其中

是有偏样本 中心矩, 是样本均值。如果 bias 为 False,则对计算进行偏差校正,计算的值是调整后的 Fisher-Pearson 标准化力矩系数,即

从 SciPy 1.9 开始,np.matrix 输入(不建议用于新代码)在执行计算之前转换为 np.ndarray。在这种情况下,输出将是标量或适当形状的 np.ndarray 而不是 2D np.matrix 。同样,虽然屏蔽数组的屏蔽元素被忽略,但输出将是标量或 np.ndarray 而不是带有 mask=False 的屏蔽数组。

参考

[1]

Zwillinger, D. 和 Kokoska, S. (2000)。 CRC 标准概率和统计表和公式。查普曼和霍尔:纽约。 2000. 第 2.2.24.1 节

例子

>>> from scipy.stats import skew
>>> skew([1, 2, 3, 4, 5])
0.0
>>> skew([2, 8, 0, 4, 1, 9, 9, 0])
0.2650554122698573

相关用法


注:本文由纯净天空筛选整理自scipy.org大神的英文原创作品 scipy.stats.skew。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。