本文简要介绍 python 语言中 scipy.sparse.csr_array
的用法。
用法:
class scipy.sparse.csr_array(arg1, shape=None, dtype=None, copy=False)#
压缩稀疏行数组。
- csr_array(D)
其中 D 是二维 ndarray
- csr_array(S)
与另一个稀疏数组或矩阵 S (相当于 S.tocsr())
- csr_array((M, N), [dtype])
构造一个形状为 (M, N) 的空数组 dtype 是可选的,默认为 dtype='d'。
- csr_array((数据, (row_ind, col_ind)), [形状=(M, N)])
其中
data
、row_ind
和col_ind
满足关系a[row_ind[k], col_ind[k]] = data[k]
。- csr_array((数据,索引,indptr),[形状=(M,N)])
是标准的 CSR 表示,其中行 i 的列索引存储在
indices[indptr[i]:indptr[i+1]]
中,并且它们的相应值存储在data[indptr[i]:indptr[i+1]]
中。如果未提供 shape 参数,则从索引数组推断数组维度。
这可以通过多种方式实例化::
注意:
稀疏数组可用于算术运算:它们支持加法、减法、乘法、除法和矩阵幂。
高效算术运算 CSR + CSR、CSR * CSR 等
高效的行切片
快速矩阵向量积
慢速列切片操作(考虑 CSC)
稀疏结构的更改代价高昂(考虑 LIL 或 DOK)
在每行中,索引按列排序。
没有重复的条目。
CSR 格式的优点:
CSR 格式的缺点:
规范格式:
例子:
>>> import numpy as np >>> from scipy.sparse import csr_array >>> csr_array((3, 4), dtype=np.int8).toarray() array([[0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0]], dtype=int8)
>>> row = np.array([0, 0, 1, 2, 2, 2]) >>> col = np.array([0, 2, 2, 0, 1, 2]) >>> data = np.array([1, 2, 3, 4, 5, 6]) >>> csr_array((data, (row, col)), shape=(3, 3)).toarray() array([[1, 0, 2], [0, 0, 3], [4, 5, 6]])
>>> indptr = np.array([0, 2, 3, 6]) >>> indices = np.array([0, 2, 2, 0, 1, 2]) >>> data = np.array([1, 2, 3, 4, 5, 6]) >>> csr_array((data, indices, indptr), shape=(3, 3)).toarray() array([[1, 0, 2], [0, 0, 3], [4, 5, 6]])
重复的条目汇总在一起:
>>> row = np.array([0, 1, 2, 0]) >>> col = np.array([0, 1, 1, 0]) >>> data = np.array([1, 2, 4, 8]) >>> csr_array((data, (row, col)), shape=(3, 3)).toarray() array([[9, 0, 0], [0, 2, 0], [0, 4, 0]])
作为如何逐步构建 CSR 数组的示例,以下代码段从文本构建 term-document 数组:
>>> docs = [["hello", "world", "hello"], ["goodbye", "cruel", "world"]] >>> indptr = [0] >>> indices = [] >>> data = [] >>> vocabulary = {} >>> for d in docs: ... for term in d: ... index = vocabulary.setdefault(term, len(vocabulary)) ... indices.append(index) ... data.append(1) ... indptr.append(len(indices)) ... >>> csr_array((data, indices, indptr), dtype=int).toarray() array([[2, 1, 0, 0], [0, 1, 1, 1]])
- dtype: 类型
数组的数据类型
shape
2元组阵列的形状。
- ndim: int
维数(始终为 2)
nnz
存储值的数量,包括显式零。
size
存储值的数量。
- data:
数组的CSR格式数据数组
- indices:
数组的CSR格式索引数组
- indptr:
数组的CSR格式索引指针数组
has_sorted_indices
索引是否排序
has_canonical_format
数组/矩阵是否具有排序索引并且没有重复项
T
转置。
属性 ::
相关用法
- Python SciPy sparse.csr_matrix用法及代码示例
- Python SciPy sparse.csc_matrix用法及代码示例
- Python SciPy sparse.csc_array用法及代码示例
- Python SciPy sparse.coo_matrix用法及代码示例
- Python SciPy sparse.coo_array用法及代码示例
- Python SciPy sparse.isspmatrix用法及代码示例
- Python SciPy sparse.save_npz用法及代码示例
- Python SciPy sparse.issparse用法及代码示例
- Python SciPy sparse.isspmatrix_csc用法及代码示例
- Python SciPy sparse.isspmatrix_csr用法及代码示例
- Python SciPy sparse.tril用法及代码示例
- Python SciPy sparse.dia_array用法及代码示例
- Python SciPy sparse.bmat用法及代码示例
- Python SciPy sparse.hstack用法及代码示例
- Python SciPy sparse.rand用法及代码示例
- Python SciPy sparse.dia_matrix用法及代码示例
- Python SciPy sparse.find用法及代码示例
- Python SciPy sparse.isspmatrix_dia用法及代码示例
- Python SciPy sparse.isspmatrix_lil用法及代码示例
- Python SciPy sparse.block_diag用法及代码示例
- Python SciPy sparse.diags用法及代码示例
- Python SciPy sparse.vstack用法及代码示例
- Python SciPy sparse.dok_matrix用法及代码示例
- Python SciPy sparse.kron用法及代码示例
- Python SciPy sparse.random用法及代码示例
注:本文由纯净天空筛选整理自scipy.org大神的英文原创作品 scipy.sparse.csr_array。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。