当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python dask.array.random.binomial用法及代码示例


用法:

dask.array.random.binomial(n, p, size=None, chunks='auto', **kwargs)

从二项分布中抽取样本。

此文档字符串是从 numpy.random.mtrand.RandomState.binomial 复制的。

可能存在与 Dask 版本的一些不一致之处。

样本是从具有指定参数、n 次试验和 p 成功概率的二项式分布中抽取的,其中 n 是一个整数 >= 0 且 p 在区间 [0,1] 内。 (n 可以作为浮点数输入,但在使用时会被截断为整数)

注意

新代码应改为使用default_rng() 实例的binomial 方法;请参阅快速入门。

参数

nint 或 数组 整数

分布参数,>= 0。浮点数也被接受,但它们将被截断为整数。

p浮点数或类似数组的浮点数

分布参数,>= 0 和 <=1。

sizeint 或整数元组,可选

输出形状。例如,如果给定的形状是 (m, n, k) ,则绘制 m * n * k 样本。如果 size 为 None(默认),如果 np 都是标量,则返回单个值。否则,将抽取np.broadcast(n, p).size 样本。

返回

outndarray 或标量

从参数化二项分布中抽取样本,其中每个样本等于 n 次试验的成功次数。

注意

二项分布的概率密度为

其中 是试验次数, 是成功概率, 是成功次数。

当使用随机样本估计总体比例的标准误差时,正态分布效果很好,除非乘积 p*n <=5,其中 p = 总体比例估计值,n = 样本数,在这种情况下取而代之的是二项分布。例如,一个 15 人的样本显示 4 个左撇子和 11 个右撇子。那么 p = 4/15 = 27%。 0.27*15 = 4,所以在这种情况下应该使用二项分布。

参考

1

Dalgaard, Peter,“R 的介绍性统计”,Springer-Verlag,2002。

2

Glantz, Stanton A. “生物统计学入门”,McGraw-Hill,第五版,2002 年。

3

伦特纳,马文,“Elementary Applied Statistics”,博格登和奎格利,1972 年。

4

Weisstein, Eric W. “二项分布”。来自MathWorld-A Wolfram Web 资源。http://mathworld.wolfram.com/BinomialDistribution.html

5

维基百科,“Binomial distribution”,https://en.wikipedia.org/wiki/Binomial_distribution

例子

从分布中抽取样本:

>>> n, p = 10, .5  # number of trials, probability of each trial  
>>> s = np.random.binomial(n, p, 1000)  
# result of flipping a coin 10 times, tested 1000 times.

一个真实世界的例子。一家公司钻了 9 口wild-cat 石油勘探井,每口井的成功概率估计为 0.1。所有九口井都失败了。这种情况发生的概率是多少?

让我们对该模型进行 20,000 次试验,并计算产生零阳性结果的数量。

>>> sum(np.random.binomial(9, 0.1, 20000) == 0)/20000.  
# answer = 0.38885, or 38%.

相关用法


注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask.array.random.binomial。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。