当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pandas.arrays.SparseArray用法及代码示例


用法:

class pandas.arrays.SparseArray(data, sparse_index=None, index=None, fill_value=None, kind='integer', dtype=None, copy=False)

用于存储稀疏数据的 ExtensionArray。

参数

dataarray-like 或标量

要存储在 SparseArray 中的密集值数组。这可能包含 fill_value

sparse_index稀疏索引,可选
index index
fill_value标量,可选

fill_value 数据中的元素不存储在 SparseArray 中。为了节省内存,这应该是 data 中最常见的值。默认情况下,fill_value 取决于 data 的 dtype:

data.dtype

na_value

float

np.nan

int

0

bool

False

datetime64

pd.NaT

timedelta64

pd.NaT

填充值可能以三种方式指定。按优先顺序,这些是

  1. fill_value 参数

  2. dtype.fill_value 如果 fill_value 是 None 并且 dtypeSparseDtype

  3. data.dtype.fill_value 如果 fill_value 是 None 并且 dtype 不是 SparseDtype 并且 dataSparseArray

kindstr

可以是‘integer’ or ‘block’,默认是‘integer’。稀疏位置的存储类型。

  • ‘block’:为稀疏值的每个连续跨度存储 blockblock_length。当稀疏数据倾向于聚集在一起时,这是最好的,在稀疏值之间有大面积的fill-value 值。

  • ‘integer’:使用整数来存储每个稀疏值的位置。

dtypenp.dtype 或 SparseDtype,可选

用于 SparseArray 的 dtype。对于 numpy dtype,这确定了 self.sp_values 的 dtype。对于 SparseDtype,这决定了 self.sp_valuesself.fill_value

copy布尔值,默认为 False

是否显式复制传入的data 数组。

例子

>>> from pandas.arrays import SparseArray
>>> arr = SparseArray([0, 0, 1, 2])
>>> arr
[0, 0, 1, 2]
Fill:0
IntIndex
Indices:array([2, 3], dtype=int32)

相关用法


注:本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.arrays.SparseArray。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。