當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python cuml.metrics.pairwise_distances.sparse_pairwise_distances用法及代碼示例


用法:

cuml.metrics.pairwise_distances.sparse_pairwise_distances(X, Y=None, metric='euclidean', handle=None, convert_dtype=True, metric_arg=2, **kwds)

從向量數組 X 和可選的 Y 計算距離矩陣。

此方法采用一個或兩個稀疏向量數組,並返回一個密集距離矩陣。

如果給定 Y(默認為 None ),則返回的矩陣是來自 XY 的數組之間的成對距離。

指標的有效值為:

  • 來自scikit-learn:[‘cityblock’, ‘cosine’, ‘euclidean’、‘l1’, ‘l2’、‘manhattan’]。
  • 從 scipy.spatial.distance: [‘sqeuclidean’, ‘canberra’, ‘minkowski’, ‘jaccard’, ‘chebyshev’, ‘dice’]

    有關這些指標的詳細信息,請參閱 scipy.spatial.distance 的文檔。

  • [‘inner_product’, ‘hellinger’]
Xarray-like(設備或主機)形狀(n_samples_x,n_features)

可接受的格式:SciPy 或 Cupy 稀疏數組

Yarray-like(設備或主機)形狀(n_samples_y,n_features),可選

可接受的格式:SciPy 或 Cupy 稀疏數組

公製{“cityblock”, “cosine”, “euclidean”、“l1”、“l2”、“manhattan”、“sqeuclidean”, “canberra”, “lp”、“inner_product”、“minkowski”、“jaccard”, “hellinger”, “chebyshev”, “linf”, “dice”}

計算特征數組中實例之間的距離時使用的度量。

convert_dtype布爾值,可選(默認 = True)

當設置為 True 時,如果 Y 不同,該方法將在必要時將 Y 轉換為與 X 相同的數據類型。這將增加用於該方法的內存。

metric_arg浮點數,可選(默認 = 2)

附加 metric-specific 參數。對於 Minkowski,這是要申請的p-norm。

返回

D數組 [n_samples_x, n_samples_x] 或 [n_samples_x, n_samples_y]

密集距離矩陣 D 使得 D_{i, j} 是給定矩陣 X 的第 i 個和第 j 個向量之間的距離,如果 Y 為無。如果 Y 不是 None ,則 D_{i, j} 是來自 X 的第 i 個數組與來自 Y 的第 j 個數組之間的距離。

例子

>>> import cupyx
>>> from cuml.metrics import sparse_pairwise_distances
>>>
>>> X = cupyx.scipy.sparse.random(2, 3, density=0.5)
>>> Y = cupyx.scipy.sparse.random(1, 3, density=0.5)
>>> X.todense()
array([[0.02797998, 0.        , 0.66309184],
       [0.        , 0.        , 0.92316052]])
>>> Y.todense()
array([[0.        , 0.        , 0.32750517]])
>>> # Cosine Pairwise Distance, Single Input:
>>> sparse_pairwise_distances(X, metric='cosine')
array([[0.        , 0.00088907],
       [0.00088907, 0.        ]])
>>>
>>> # Squared euclidean Pairwise Distance, Multi-Input:
>>> sparse_pairwise_distances(X, Y, metric='sqeuclidean')
array([[0.11340129],
       [0.3548053]])
>>>
>>> # Canberra Pairwise Distance, Multi-Input:
>>> sparse_pairwise_distances(X, Y, metric='canberra')
array([[1.33877214],
       [0.47627064]])

相關用法


注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cuml.metrics.pairwise_distances.sparse_pairwise_distances。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。