用法:
cuml.metrics.pairwise_distances.sparse_pairwise_distances(X, Y=None, metric='euclidean', handle=None, convert_dtype=True, metric_arg=2, **kwds)
从向量数组
X
和可选的Y
计算距离矩阵。此方法采用一个或两个稀疏向量数组,并返回一个密集距离矩阵。
如果给定
Y
(默认为None
),则返回的矩阵是来自X
和Y
的数组之间的成对距离。指标的有效值为:
- 来自scikit-learn:[‘cityblock’, ‘cosine’, ‘euclidean’、‘l1’, ‘l2’、‘manhattan’]。
- 从 scipy.spatial.distance: [‘sqeuclidean’, ‘canberra’, ‘minkowski’, ‘jaccard’, ‘chebyshev’, ‘dice’]
有关这些指标的详细信息,请参阅 scipy.spatial.distance 的文档。
- [‘inner_product’, ‘hellinger’]
- Xarray-like(设备或主机)形状(n_samples_x,n_features)
可接受的格式:SciPy 或 Cupy 稀疏数组
- Yarray-like(设备或主机)形状(n_samples_y,n_features),可选
可接受的格式:SciPy 或 Cupy 稀疏数组
- 公制{“cityblock”, “cosine”, “euclidean”、“l1”、“l2”、“manhattan”、“sqeuclidean”, “canberra”, “lp”、“inner_product”、“minkowski”、“jaccard”, “hellinger”, “chebyshev”, “linf”, “dice”}
计算特征数组中实例之间的距离时使用的度量。
- convert_dtype布尔值,可选(默认 = True)
当设置为 True 时,如果 Y 不同,该方法将在必要时将 Y 转换为与 X 相同的数据类型。这将增加用于该方法的内存。
- metric_arg浮点数,可选(默认 = 2)
附加 metric-specific 参数。对于 Minkowski,这是要申请的p-norm。
- D:数组 [n_samples_x, n_samples_x] 或 [n_samples_x, n_samples_y]
密集距离矩阵 D 使得 D_{i, j} 是给定矩阵
X
的第 i 个和第 j 个向量之间的距离,如果Y
为无。如果Y
不是None
,则 D_{i, j} 是来自X
的第 i 个数组与来自Y
的第 j 个数组之间的距离。
返回:
例子:
>>> import cupyx >>> from cuml.metrics import sparse_pairwise_distances >>> >>> X = cupyx.scipy.sparse.random(2, 3, density=0.5) >>> Y = cupyx.scipy.sparse.random(1, 3, density=0.5) >>> X.todense() array([[0.02797998, 0. , 0.66309184], [0. , 0. , 0.92316052]]) >>> Y.todense() array([[0. , 0. , 0.32750517]]) >>> # Cosine Pairwise Distance, Single Input: >>> sparse_pairwise_distances(X, metric='cosine') array([[0. , 0.00088907], [0.00088907, 0. ]]) >>> >>> # Squared euclidean Pairwise Distance, Multi-Input: >>> sparse_pairwise_distances(X, Y, metric='sqeuclidean') array([[0.11340129], [0.3548053]]) >>> >>> # Canberra Pairwise Distance, Multi-Input: >>> sparse_pairwise_distances(X, Y, metric='canberra') array([[1.33877214], [0.47627064]])
相关用法
- Python cuml.metrics.pairwise_distances.pairwise_distances用法及代码示例
- Python cuml.metrics.precision_recall_curve用法及代码示例
- Python cuml.metrics.roc_auc_score用法及代码示例
- Python cuml.metrics.log_loss用法及代码示例
- Python cuml.multiclass.OneVsRestClassifier用法及代码示例
- Python cuml.model_selection.train_test_split用法及代码示例
- Python cuml.multiclass.OneVsOneClassifier用法及代码示例
- Python cuml.multiclass.MulticlassClassifier用法及代码示例
- Python cuml.neighbors.KNeighborsClassifier用法及代码示例
- Python cuml.ensemble.RandomForestRegressor用法及代码示例
- Python cuml.svm.SVC用法及代码示例
- Python cuml.svm.SVR用法及代码示例
- Python cuml.Lasso用法及代码示例
- Python cuml.tsa.ARIMA.predict用法及代码示例
- Python cuml.preprocessing.LabelBinarizer用法及代码示例
- Python cuml.random_projection.GaussianRandomProjection用法及代码示例
- Python cuml.MBSGDRegressor用法及代码示例
- Python cuml.experimental.preprocessing.PolynomialFeatures用法及代码示例
- Python cuml.PCA用法及代码示例
- Python cuml.feature_extraction.text.HashingVectorizer用法及代码示例
注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cuml.metrics.pairwise_distances.sparse_pairwise_distances。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。