当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn MDS用法及代码示例


本文简要介绍python语言中 sklearn.manifold.MDS 的用法。

用法:

class sklearn.manifold.MDS(n_components=2, *, metric=True, n_init=4, max_iter=300, verbose=0, eps=0.001, n_jobs=None, random_state=None, dissimilarity='euclidean')

多维缩放。

在用户指南中阅读更多信息。

参数

n_components整数,默认=2

将差异浸入其中的维度数。

metric布尔,默认=真

如果 True ,执行度量 MDS;否则,执行非度量 MDS。

n_init整数,默认=4

SMACOF 算法将以不同的初始化运行的次数。最终结果将是运行的最佳输出,由最终应力最小的运行确定。

max_iter整数,默认=300

SMACOF 算法单次运行的最大迭代次数。

verbose整数,默认=0

详细程度。

eps浮点数,默认=1e-3

关于宣布收敛的应力的相对容差。

n_jobs整数,默认=无

用于计算的作业数。如果使用多个初始化 (n_init),则算法的每次运行都是并行计算的。

None 表示 1,除非在 joblib.parallel_backend 上下文中。 -1 表示使用所有处理器。有关详细信息,请参阅词汇表。

random_stateint、RandomState 实例或无,默认=无

确定用于初始化中心的随机数生成器。传递 int 以获得跨多个函数调用的可重现结果。请参阅术语表。

dissimilarity{‘euclidean’, ‘precomputed’},默认='欧几里得'

要使用的差异度量:

  • ‘euclidean’:

    数据集中点之间的成对欧几里得距离。

  • ‘precomputed’:

    预先计算的差异直接传递给 fitfit_transform

属性

embedding_ndarray 形状(n_samples,n_components)

将数据集的位置存储在嵌入空间中。

stress_浮点数

应力的最终值(视差的平方距离与所有约束点的距离之和)。

dissimilarity_matrix_ndarray 形状(n_samples,n_samples)

点之间的成对差异。对称矩阵:

  • 或者通过将dissimilarity设置为‘precomputed’来使用自定义相异矩阵;
  • 或使用欧几里得距离从数据构造相异矩阵。
n_features_in_int

拟合期间看到的特征数。

feature_names_in_ndarray 形状(n_features_in_,)

拟合期间看到的特征名称。仅当 X 具有全为字符串的函数名称时才定义。

n_iter_int

最佳应力对应的迭代次数。

参考

“现代多维尺度——理论与应用”Borg, I.; Groenen P. Springer 统计系列(1997 年)

“非度量多维标度:一种数值方法”Kruskal, J. Psychometrika, 29 (1964)

“通过优化非度量假设的拟合优度来进行多维缩放” Kruskal, J. Psychometrika, 29, (1964)

例子

>>> from sklearn.datasets import load_digits
>>> from sklearn.manifold import MDS
>>> X, _ = load_digits(return_X_y=True)
>>> X.shape
(1797, 64)
>>> embedding = MDS(n_components=2)
>>> X_transformed = embedding.fit_transform(X[:100])
>>> X_transformed.shape
(100, 2)

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.manifold.MDS。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。