当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.array.random.normal用法及代码示例


用法:

dask.array.random.normal(loc=0.0, scale=1.0, size=None, chunks='auto', **kwargs)

从正态(高斯)分布中抽取随机样本。

此文档字符串是从 numpy.random.mtrand.RandomState.normal 复制而来的。

可能存在与 Dask 版本的一些不一致之处。

正态分布的概率密度函数首先由 De Moivre 导出,200 年后由 Gauss 和 Laplace 独立导出[2],由于其特征形状,通常被称为钟形曲线(参见下面的示例)。

正态分布在自然界中经常发生。例如,它说明了受大量微小随机干扰影响的样本的普遍分布,每个干扰都有自己独特的分布[2]

注意

新代码应改为使用default_rng() 实例的normal 方法;请参阅快速入门。

参数

loc浮点数或类似数组的浮点数

分布的平均值 (“centre”)。

scale浮点数或类似数组的浮点数

分布的标准差(spread 或“width”)。必须是非负数。

sizeint 或整数元组,可选

输出形状。例如,如果给定的形状是 (m, n, k) ,则绘制 m * n * k 样本。如果 size 为 None(默认),如果 locscale 都是标量,则返回单个值。否则,将抽取np.broadcast(loc, scale).size 样本。

返回

outndarray 或标量

从参数化正态分布中抽取样本。

注意

高斯分布的概率密度为

其中 是平均值, 是标准差。标准差的平方 称为方差。

该函数在平均值处有其峰值,其 “spread” 随着标准差的增加而增加(函数在 [2] 处达到其最大值的 0.607 倍)。这意味着 normal 更有可能返回接近平均值的样本,而不是远离平均值的样本。

参考

1

维基百科,“Normal distribution”,https://en.wikipedia.org/wiki/Normal_distribution

2(123)

P. R. Peebles Jr.,“Central Limit Theorem”,“概率、随机变量和随机信号原理”,第 4 版,2001 年,第 51、51、125 页。

例子

从分布中抽取样本:

>>> mu, sigma = 0, 0.1 # mean and standard deviation  
>>> s = np.random.normal(mu, sigma, 1000)

验证均值和方差:

>>> abs(mu - np.mean(s))  
0.0  # may vary
>>> abs(sigma - np.std(s, ddof=1))  
0.1  # may vary

显示样本的直方图以及概率密度函数:

>>> import matplotlib.pyplot as plt  
>>> count, bins, ignored = plt.hist(s, 30, density=True)  
>>> plt.plot(bins, 1/(sigma * np.sqrt(2 * np.pi)) *  
...                np.exp( - (bins - mu)**2 / (2 * sigma**2) ),
...          linewidth=2, color='r')
>>> plt.show()

Two-by-four 来自 N(3, 6.25) 的样本数组:

>>> np.random.normal(3, 2.5, size=(2, 4))  
array([[-4.49401501,  4.00950034, -1.81814867,  7.29718677],   # random
       [ 0.39924804,  4.68456316,  4.99394529,  4.84057254]])  # random

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.array.random.normal。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。