Python SciPy stats.yeojohnson用法及代码示例

本文简要介绍 python 语言中 scipy.stats.yeojohnson 的用法。

用法: scipy.stats.yeojohnson(x, lmbda=None)#

返回由Yeo-Johnson 幂变换变换的数据集。

参数：：

x： ndarray: 输入数组。应该是一维的。
lmbda：浮点数，可选: 如果 lmbda 是 None ，找到最大化对数似然函数的 lambda 并将其作为第二个输出参数返回。否则，将对给定值进行转换。

约约翰逊：ndarray: Yeo-Johnson 幂变换数组。
maxlog：浮点数，可选: 如果 lmbda 参数为 None，则第二个返回参数是最大化对数似然函数的 lambda。

注意：

Yeo-Johnson 变换由下式给出：

y = ((x + 1)**lmbda - 1) / lmbda,                for x >= 0, lmbda != 0
    log(x + 1),                                  for x >= 0, lmbda = 0
    -((-x + 1)**(2 - lmbda) - 1) / (2 - lmbda),  for x < 0, lmbda != 2
    -log(-x + 1),                                for x < 0, lmbda = 2

与 boxcox 不同，yeojohnson 不要求输入数据为正。

参考：

I. Yeo 和 R.A. Johnson，“用于改善常态或对称性的新型电源转换系列”，Biometrika 87.4 (2000)：

例子：

>>> from scipy import stats
>>> import matplotlib.pyplot as plt

我们从非正态分布中生成一些随机变量，并为它制作一个概率图，以表明它在尾部是非正态的：

>>> fig = plt.figure()
>>> ax1 = fig.add_subplot(211)
>>> x = stats.loggamma.rvs(5, size=500) + 5
>>> prob = stats.probplot(x, dist=stats.norm, plot=ax1)
>>> ax1.set_xlabel('')
>>> ax1.set_title('Probplot against normal distribution')

我们现在使用 yeojohnson 来转换数据，使其最接近正常：

>>> ax2 = fig.add_subplot(212)
>>> xt, lmbda = stats.yeojohnson(x)
>>> prob = stats.probplot(xt, dist=stats.norm, plot=ax2)
>>> ax2.set_title('Probplot after Yeo-Johnson transformation')

>>> plt.show()

相关用法

注：本文由纯净天空筛选整理自scipy.org大神的英文原创作品 scipy.stats.yeojohnson。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

参数 ：：

返回 ：：

注意：

参考：

例子：

参数：：

返回：：