當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pandas.DataFrame.to_hdf用法及代碼示例


用法:

DataFrame.to_hdf(path_or_buf, key, mode='a', complevel=None, complib=None, append=False, format=None, index=True, min_itemsize=None, nan_rep=None, dropna=None, data_columns=None, errors='strict', encoding='UTF-8')

使用 HDFStore 將包含的數據寫入 HDF5 文件。

分層數據格式 (HDF) 是自說明的,允許應用程序在沒有外部信息的情況下解釋文件的結構和內容。一個 HDF 文件可以包含相關對象的組合,這些對象可以作為一個組或單個對象進行訪問。

為了向現有 HDF 文件添加另一個 DataFrame 或 Series,請使用附加模式和不同的 a 鍵。

警告

可以將DataFrameSeries 的子類存儲到HDF5,但子類的類型在存儲時會丟失。

有關詳細信息,請參閱用戶指南。

參數

path_or_bufstr 或 pandas.HDFStore

文件路徑或 HDFStore 對象。

keystr

商店中組的標識符。

mode{‘a’, ‘w’, ‘r+’}, 默認 ‘a’

文件打開方式:

  • ‘w’:write,創建一個新文件(現有的同名文件將被刪除)。

  • ‘a’:append,打開現有文件進行讀寫,如果文件不存在則創建。

  • ‘r+’:類似於‘a’,但文件必須已經存在。

complevel{0-9},默認無

指定數據的壓縮級別。值 0 或 None 禁用壓縮。

complib{‘zlib’, ‘lzo’, ‘bzip2’, ‘blosc’},默認 ‘zlib’

指定要使用的壓縮庫。從 v0.20.2 開始,支持 Blosc 的這些附加壓縮器(如果未指定壓縮器,則默認為:'blosc:blosclz'):{'blosc:blosclz', 'blosc:lz4', 'blosc:lz4hc', 'blosc:snappy' , 'blosc:zlib', 'blosc:zstd'}。指定不可用的壓縮庫會引發 ValueError。

append布爾值,默認為 False

對於表格格式,將輸入數據附加到現有的。

format{‘fixed’, ‘table’, 無},默認 ‘fixed’

可能的值:

  • ‘fixed’:固定格式。快速寫/讀。 Not-appendable,也無法搜索。

  • ‘table’:表格格式。編寫為 PyTables 表結構,其性能可能會更差,但允許更靈活的操作,例如搜索/選擇數據子集。

  • 如果沒有,則檢查 pd.get_option(‘io.hdf.default_format’),然後回退到 “fixed”。

errorsstr,默認 ‘strict’

指定如何處理編碼和解碼錯誤。有關選項的完整列表,請參閱 open() 的錯誤參數。

encodingstr,默認 “UTF-8”
min_itemsizedict 或 int,可選

將列名映射到列的最小字符串大小。

nan_rep任意,可選

如何將空值表示為 str。不允許使用 append=True。

data_columns列列表或 True,可選

要創建為 on-disk 查詢的索引數據列的列列表,或 True 以使用所有列。默認情況下,隻有對象的軸被索引。請參閱通過數據列查詢。僅適用於 format='table'。

例子

>>> df = pd.DataFrame({'A':[1, 2, 3], 'B':[4, 5, 6]},
...                   index=['a', 'b', 'c'])  
>>> df.to_hdf('data.h5', key='df', mode='w')

我們可以在同一個文件中添加另一個對象:

>>> s = pd.Series([1, 2, 3, 4])  
>>> s.to_hdf('data.h5', key='s')

從 HDF 文件中讀取:

>>> pd.read_hdf('data.h5', 'df')  
A  B
a  1  4
b  2  5
c  3  6
>>> pd.read_hdf('data.h5', 's')  
0    1
1    2
2    3
3    4
dtype:int64

相關用法


注:本文由純淨天空篩選整理自pandas.pydata.org大神的英文原創作品 pandas.DataFrame.to_hdf。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。