当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cuml.metrics.pairwise_distances.sparse_pairwise_distances用法及代码示例


用法:

cuml.metrics.pairwise_distances.sparse_pairwise_distances(X, Y=None, metric='euclidean', handle=None, convert_dtype=True, metric_arg=2, **kwds)

从向量数组 X 和可选的 Y 计算距离矩阵。

此方法采用一个或两个稀疏向量数组,并返回一个密集距离矩阵。

如果给定 Y(默认为 None ),则返回的矩阵是来自 XY 的数组之间的成对距离。

指标的有效值为:

  • 来自scikit-learn:[‘cityblock’, ‘cosine’, ‘euclidean’、‘l1’, ‘l2’、‘manhattan’]。
  • 从 scipy.spatial.distance: [‘sqeuclidean’, ‘canberra’, ‘minkowski’, ‘jaccard’, ‘chebyshev’, ‘dice’]

    有关这些指标的详细信息,请参阅 scipy.spatial.distance 的文档。

  • [‘inner_product’, ‘hellinger’]
Xarray-like(设备或主机)形状(n_samples_x,n_features)

可接受的格式:SciPy 或 Cupy 稀疏数组

Yarray-like(设备或主机)形状(n_samples_y,n_features),可选

可接受的格式:SciPy 或 Cupy 稀疏数组

公制{“cityblock”, “cosine”, “euclidean”、“l1”、“l2”、“manhattan”、“sqeuclidean”, “canberra”, “lp”、“inner_product”、“minkowski”、“jaccard”, “hellinger”, “chebyshev”, “linf”, “dice”}

计算特征数组中实例之间的距离时使用的度量。

convert_dtype布尔值,可选(默认 = True)

当设置为 True 时,如果 Y 不同,该方法将在必要时将 Y 转换为与 X 相同的数据类型。这将增加用于该方法的内存。

metric_arg浮点数,可选(默认 = 2)

附加 metric-specific 参数。对于 Minkowski,这是要申请的p-norm。

返回

D数组 [n_samples_x, n_samples_x] 或 [n_samples_x, n_samples_y]

密集距离矩阵 D 使得 D_{i, j} 是给定矩阵 X 的第 i 个和第 j 个向量之间的距离,如果 Y 为无。如果 Y 不是 None ,则 D_{i, j} 是来自 X 的第 i 个数组与来自 Y 的第 j 个数组之间的距离。

例子

>>> import cupyx
>>> from cuml.metrics import sparse_pairwise_distances
>>>
>>> X = cupyx.scipy.sparse.random(2, 3, density=0.5)
>>> Y = cupyx.scipy.sparse.random(1, 3, density=0.5)
>>> X.todense()
array([[0.02797998, 0.        , 0.66309184],
       [0.        , 0.        , 0.92316052]])
>>> Y.todense()
array([[0.        , 0.        , 0.32750517]])
>>> # Cosine Pairwise Distance, Single Input:
>>> sparse_pairwise_distances(X, metric='cosine')
array([[0.        , 0.00088907],
       [0.00088907, 0.        ]])
>>>
>>> # Squared euclidean Pairwise Distance, Multi-Input:
>>> sparse_pairwise_distances(X, Y, metric='sqeuclidean')
array([[0.11340129],
       [0.3548053]])
>>>
>>> # Canberra Pairwise Distance, Multi-Input:
>>> sparse_pairwise_distances(X, Y, metric='canberra')
array([[1.33877214],
       [0.47627064]])

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cuml.metrics.pairwise_distances.sparse_pairwise_distances。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。