Python cuml.datasets.make_blobs用法及代码示例

用法: cuml.datasets.make_blobs(n_samples=100, n_features=2, centers=None, cluster_std=1.0, center_box=(- 10.0, 10.0), shuffle=True, random_state=None, return_centers=False, order='F', dtype='float32')

生成用于聚类的各向同性高斯斑点。

参数：

n_samples：int 或array-like，可选(默认=100): 如果是 int，则它是在集群之间平均分配的点的总数。如果array-like，则序列的每个元素表示每个簇的样本数。
n_features：int，可选(默认=2): 每个样本的特征数。
centers：int 或形状数组 [n_centers , n_features]，可选: (默认=无)要生成的中心数，或固定的中心位置。如果 n_samples 是 int 并且中心是 None，则生成 3 个中心。如果 n_samples 是 array-like，则中心必须是 None 或长度等于 n_samples 长度的数组。
cluster_std：浮点数或浮点数序列，可选(默认=1.0): 聚类的标准差。
center_box：一对浮点数(最小，最大)，可选(默认=(-10.0，10.0)): 随机生成中心时每个聚类中心的边界框。
shuffle：布尔值，可选(默认 = True): Shuffle[洗牌]样本。
random_state：int，RandomState 实例，默认=None: 确定数据集创建的随机数生成。跨多个函数调用传递一个 int 以实现可重现的输出。
return_centers：布尔，可选(默认=假): 如果为真，则返回每个聚类的中心
order: str, optional (default=’F’)：: 生成样本的顺序
dtype：str，可选(默认='float32'): 生成样本的 Dtype

X：形状为 [n_samples, n_features] 的设备数组: 生成的样本。
y：形状为 [n_samples] 的设备数组: 每个样本的集群成员的整数标签。
centers：设备数组，形状 [n_centers, n_features]: 每个集群的中心。仅在 return_centers=True 时返回。

例子：

>>> from sklearn.datasets import make_blobs
>>> X, y = make_blobs(n_samples=10, centers=3, n_features=2,
...                   random_state=0)
>>> print(X.shape)
(10, 2)
>>> y
array([0, 0, 1, 0, 2, 2, 2, 1, 1, 0])
>>> X, y = make_blobs(n_samples=[3, 3, 4], centers=None, n_features=2,
...                   random_state=0)
>>> print(X.shape)
(10, 2)
>>> y
array([0, 1, 2, 0, 2, 2, 2, 1, 1, 0])

相关用法

注：本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cuml.datasets.make_blobs。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

参数：

返回：

例子：