本文简要介绍python语言中 sklearn.datasets.make_blobs
的用法。
用法:
sklearn.datasets.make_blobs(n_samples=100, n_features=2, *, centers=None, cluster_std=1.0, center_box=(- 10.0, 10.0), shuffle=True, random_state=None, return_centers=False)
生成用于聚类的各向同性高斯斑点。
在用户指南中阅读更多信息。
- n_samples:int 或类似数组,默认=100
如果是 int,则为在簇之间平均分配的点数总数。如果是类似数组,则序列的每个元素表示每个簇的样本数。
- n_features:整数,默认=2
每个样本的特征数。
- centers:int 或形状的 ndarray (n_centers, n_features),默认=无
要生成的中心数量或固定中心位置。如果n_samples是int并且centers是None,则生成3个中心。如果 n_samples 是类似数组的,则 center 必须为 None 或长度等于 n_samples 长度的数组。
- cluster_std:float 或类似 float 的数组,默认=1.0
聚类的标准差。
- center_box:浮点元组(最小值,最大值),默认=(-10.0,10.0)
随机生成中心时每个聚类中心的边界框。
- shuffle:布尔,默认=真
Shuffle[洗牌]样本。
- random_state:int、RandomState 实例或无,默认=无
确定数据集创建的随机数生成。传递 int 以获得跨多个函数调用的可重现输出。请参阅词汇表。
- return_centers:布尔,默认=假
如果为真,则返回每个聚类的中心
- X:ndarray 形状(n_samples,n_features)
生成的样本。
- y:ndarray 形状 (n_samples,)
每个样本的集群成员的整数标签。
- centers:ndarray 形状(n_centers,n_features)
每个集群的中心。仅在
return_centers=True
时返回。
参数:
返回:
例子:
>>> from sklearn.datasets import make_blobs >>> X, y = make_blobs(n_samples=10, centers=3, n_features=2, ... random_state=0) >>> print(X.shape) (10, 2) >>> y array([0, 0, 1, 0, 2, 2, 2, 1, 1, 0]) >>> X, y = make_blobs(n_samples=[3, 3, 4], centers=None, n_features=2, ... random_state=0) >>> print(X.shape) (10, 2) >>> y array([0, 1, 2, 0, 2, 2, 2, 1, 1, 0])
相关用法
- Python sklearn make_pipeline用法及代码示例
- Python sklearn make_hastie_10_2用法及代码示例
- Python sklearn make_union用法及代码示例
- Python sklearn make_friedman2用法及代码示例
- Python sklearn make_friedman1用法及代码示例
- Python sklearn make_column_transformer用法及代码示例
- Python sklearn make_scorer用法及代码示例
- Python sklearn make_column_selector用法及代码示例
- Python sklearn make_sparse_uncorrelated用法及代码示例
- Python sklearn make_low_rank_matrix用法及代码示例
- Python sklearn make_friedman3用法及代码示例
- Python sklearn max_error用法及代码示例
- Python sklearn manhattan_distances用法及代码示例
- Python sklearn matthews_corrcoef用法及代码示例
- Python sklearn mean_pinball_loss用法及代码示例
- Python sklearn median_absolute_error用法及代码示例
- Python sklearn minmax_scale用法及代码示例
- Python sklearn mean_gamma_deviance用法及代码示例
- Python sklearn mean_absolute_percentage_error用法及代码示例
- Python sklearn mean_absolute_error用法及代码示例
- Python sklearn mean_squared_error用法及代码示例
- Python sklearn multilabel_confusion_matrix用法及代码示例
- Python sklearn mean_tweedie_deviance用法及代码示例
- Python sklearn mean_poisson_deviance用法及代码示例
- Python sklearn mean_squared_log_error用法及代码示例
注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.datasets.make_blobs。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。