当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn make_blobs用法及代码示例


本文简要介绍python语言中 sklearn.datasets.make_blobs 的用法。

用法:

sklearn.datasets.make_blobs(n_samples=100, n_features=2, *, centers=None, cluster_std=1.0, center_box=(- 10.0, 10.0), shuffle=True, random_state=None, return_centers=False)

生成用于聚类的各向同性高斯斑点。

在用户指南中阅读更多信息。

参数

n_samplesint 或类似数组,默认=100

如果是 int,则为在簇之间平均分配的点数总数。如果是类似数组,则序列的每个元素表示每个簇的样本数。

n_features整数,默认=2

每个样本的特征数。

centersint 或形状的 ndarray (n_centers, n_features),默认=无

要生成的中心数量或固定中心位置。如果n_samples是int并且centers是None,则生成3个中心。如果 n_samples 是类似数组的,则 center 必须为 None 或长度等于 n_samples 长度的数组。

cluster_stdfloat 或类似 float 的数组,默认=1.0

聚类的标准差。

center_box浮点元组(最小值,最大值),默认=(-10.0,10.0)

随机生成中心时每个聚类中心的边界框。

shuffle布尔,默认=真

Shuffle[洗牌]样本。

random_stateint、RandomState 实例或无,默认=无

确定数据集创建的随机数生成。传递 int 以获得跨多个函数调用的可重现输出。请参阅词汇表。

return_centers布尔,默认=假

如果为真,则返回每个聚类的中心

返回

Xndarray 形状(n_samples,n_features)

生成的样本。

yndarray 形状 (n_samples,)

每个样本的集群成员的整数标签。

centersndarray 形状(n_centers,n_features)

每个集群的中心。仅在 return_centers=True 时返回。

例子

>>> from sklearn.datasets import make_blobs
>>> X, y = make_blobs(n_samples=10, centers=3, n_features=2,
...                   random_state=0)
>>> print(X.shape)
(10, 2)
>>> y
array([0, 0, 1, 0, 2, 2, 2, 1, 1, 0])
>>> X, y = make_blobs(n_samples=[3, 3, 4], centers=None, n_features=2,
...                   random_state=0)
>>> print(X.shape)
(10, 2)
>>> y
array([0, 1, 2, 0, 2, 2, 2, 1, 1, 0])

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.datasets.make_blobs。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。