當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pandas.arrays.SparseArray用法及代碼示例


用法:

class pandas.arrays.SparseArray(data, sparse_index=None, index=None, fill_value=None, kind='integer', dtype=None, copy=False)

用於存儲稀疏數據的 ExtensionArray。

參數

dataarray-like 或標量

要存儲在 SparseArray 中的密集值數組。這可能包含 fill_value

sparse_index稀疏索引,可選
index index
fill_value標量,可選

fill_value 數據中的元素不存儲在 SparseArray 中。為了節省內存,這應該是 data 中最常見的值。默認情況下,fill_value 取決於 data 的 dtype:

data.dtype

na_value

float

np.nan

int

0

bool

False

datetime64

pd.NaT

timedelta64

pd.NaT

填充值可能以三種方式指定。按優先順序,這些是

  1. fill_value 參數

  2. dtype.fill_value 如果 fill_value 是 None 並且 dtypeSparseDtype

  3. data.dtype.fill_value 如果 fill_value 是 None 並且 dtype 不是 SparseDtype 並且 dataSparseArray

kindstr

可以是‘integer’ or ‘block’,默認是‘integer’。稀疏位置的存儲類型。

  • ‘block’:為稀疏值的每個連續跨度存儲 blockblock_length。當稀疏數據傾向於聚集在一起時,這是最好的,在稀疏值之間有大麵積的fill-value 值。

  • ‘integer’:使用整數來存儲每個稀疏值的位置。

dtypenp.dtype 或 SparseDtype,可選

用於 SparseArray 的 dtype。對於 numpy dtype,這確定了 self.sp_values 的 dtype。對於 SparseDtype,這決定了 self.sp_valuesself.fill_value

copy布爾值,默認為 False

是否顯式複製傳入的data 數組。

例子

>>> from pandas.arrays import SparseArray
>>> arr = SparseArray([0, 0, 1, 2])
>>> arr
[0, 0, 1, 2]
Fill:0
IntIndex
Indices:array([2, 3], dtype=int32)

相關用法


注:本文由純淨天空篩選整理自pandas.pydata.org大神的英文原創作品 pandas.arrays.SparseArray。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。