當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python sklearn make_blobs用法及代碼示例


本文簡要介紹python語言中 sklearn.datasets.make_blobs 的用法。

用法:

sklearn.datasets.make_blobs(n_samples=100, n_features=2, *, centers=None, cluster_std=1.0, center_box=(- 10.0, 10.0), shuffle=True, random_state=None, return_centers=False)

生成用於聚類的各向同性高斯斑點。

在用戶指南中閱讀更多信息。

參數

n_samplesint 或類似數組,默認=100

如果是 int,則為在簇之間平均分配的點數總數。如果是類似數組,則序列的每個元素表示每個簇的樣本數。

n_features整數,默認=2

每個樣本的特征數。

centersint 或形狀的 ndarray (n_centers, n_features),默認=無

要生成的中心數量或固定中心位置。如果n_samples是int並且centers是None,則生成3個中心。如果 n_samples 是類似數組的,則 center 必須為 None 或長度等於 n_samples 長度的數組。

cluster_stdfloat 或類似 float 的數組,默認=1.0

聚類的標準差。

center_box浮點元組(最小值,最大值),默認=(-10.0,10.0)

隨機生成中心時每個聚類中心的邊界框。

shuffle布爾,默認=真

Shuffle[洗牌]樣本。

random_stateint、RandomState 實例或無,默認=無

確定數據集創建的隨機數生成。傳遞 int 以獲得跨多個函數調用的可重現輸出。請參閱詞匯表。

return_centers布爾,默認=假

如果為真,則返回每個聚類的中心

返回

Xndarray 形狀(n_samples,n_features)

生成的樣本。

yndarray 形狀 (n_samples,)

每個樣本的集群成員的整數標簽。

centersndarray 形狀(n_centers,n_features)

每個集群的中心。僅在 return_centers=True 時返回。

例子

>>> from sklearn.datasets import make_blobs
>>> X, y = make_blobs(n_samples=10, centers=3, n_features=2,
...                   random_state=0)
>>> print(X.shape)
(10, 2)
>>> y
array([0, 0, 1, 0, 2, 2, 2, 1, 1, 0])
>>> X, y = make_blobs(n_samples=[3, 3, 4], centers=None, n_features=2,
...                   random_state=0)
>>> print(X.shape)
(10, 2)
>>> y
array([0, 1, 2, 0, 2, 2, 2, 1, 1, 0])

相關用法


注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.datasets.make_blobs。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。