用法:
cuml.datasets.make_blobs(n_samples=100, n_features=2, centers=None, cluster_std=1.0, center_box=(- 10.0, 10.0), shuffle=True, random_state=None, return_centers=False, order='F', dtype='float32')
生成用于聚类的各向同性高斯斑点。
- n_samples:int 或array-like,可选(默认=100)
如果是 int,则它是在集群之间平均分配的点的总数。如果array-like,则序列的每个元素表示每个簇的样本数。
- n_features:int,可选(默认=2)
每个样本的特征数。
- centers:int 或形状数组 [
n_centers
,n_features
],可选 (默认=无)要生成的中心数,或固定的中心位置。如果
n_samples
是 int 并且中心是 None,则生成 3 个中心。如果n_samples
是 array-like,则中心必须是 None 或长度等于n_samples
长度的数组。- cluster_std:浮点数或浮点数序列,可选(默认=1.0)
聚类的标准差。
- center_box:一对浮点数(最小,最大),可选(默认=(-10.0,10.0))
随机生成中心时每个聚类中心的边界框。
- shuffle:布尔值,可选(默认 = True)
Shuffle[洗牌]样本。
- random_state:int,RandomState 实例,默认=None
确定数据集创建的随机数生成。跨多个函数调用传递一个 int 以实现可重现的输出。
- return_centers:布尔,可选(默认=假)
如果为真,则返回每个聚类的中心
- order: str, optional (default=’F’):
生成样本的顺序
- dtype:str,可选(默认='float32')
生成样本的 Dtype
- X:形状为 [n_samples, n_features] 的设备数组
生成的样本。
- y:形状为 [n_samples] 的设备数组
每个样本的集群成员的整数标签。
- centers:设备数组,形状 [n_centers, n_features]
每个集群的中心。仅在
return_centers=True
时返回。
参数:
返回:
例子:
>>> from sklearn.datasets import make_blobs >>> X, y = make_blobs(n_samples=10, centers=3, n_features=2, ... random_state=0) >>> print(X.shape) (10, 2) >>> y array([0, 0, 1, 0, 2, 2, 2, 1, 1, 0]) >>> X, y = make_blobs(n_samples=[3, 3, 4], centers=None, n_features=2, ... random_state=0) >>> print(X.shape) (10, 2) >>> y array([0, 1, 2, 0, 2, 2, 2, 1, 1, 0])
相关用法
- Python cuml.datasets.make_classification用法及代码示例
- Python cuml.datasets.make_arima用法及代码示例
- Python cuml.datasets.make_regression用法及代码示例
- Python cuml.dask.feature_extraction.text.TfidfTransformer用法及代码示例
- Python cuml.dask.manifold.UMAP用法及代码示例
- Python cuml.dask.datasets.classification.make_classification用法及代码示例
- Python cuml.dask.decomposition.PCA用法及代码示例
- Python cuml.dask.naive_bayes.MultinomialNB用法及代码示例
- Python cuml.dask.decomposition.TruncatedSVD用法及代码示例
- Python cuml.dask.preprocessing.LabelBinarizer用法及代码示例
- Python cuml.metrics.pairwise_distances.pairwise_distances用法及代码示例
- Python cuml.neighbors.KNeighborsClassifier用法及代码示例
- Python cuml.ensemble.RandomForestRegressor用法及代码示例
- Python cuml.svm.SVC用法及代码示例
- Python cuml.svm.SVR用法及代码示例
- Python cuml.Lasso用法及代码示例
- Python cuml.tsa.ARIMA.predict用法及代码示例
- Python cuml.multiclass.OneVsRestClassifier用法及代码示例
- Python cuml.preprocessing.LabelBinarizer用法及代码示例
- Python cuml.random_projection.GaussianRandomProjection用法及代码示例
注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cuml.datasets.make_blobs。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。