用法:
DataFrame.to_hdf(path_or_buf, key, mode='a', complevel=None, complib=None, append=False, format=None, index=True, min_itemsize=None, nan_rep=None, dropna=None, data_columns=None, errors='strict', encoding='UTF-8')
使用 HDFStore 将包含的数据写入 HDF5 文件。
分层数据格式 (HDF) 是自说明的,允许应用程序在没有外部信息的情况下解释文件的结构和内容。一个 HDF 文件可以包含相关对象的组合,这些对象可以作为一个组或单个对象进行访问。
为了向现有 HDF 文件添加另一个 DataFrame 或 Series,请使用附加模式和不同的 a 键。
警告
可以将
DataFrame
或Series
的子类存储到HDF5,但子类的类型在存储时会丢失。有关详细信息,请参阅用户指南。
- path_or_buf:str 或 pandas.HDFStore
文件路径或 HDFStore 对象。
- key:str
商店中组的标识符。
- mode:{‘a’, ‘w’, ‘r+’}, 默认 ‘a’
文件打开方式:
‘w’:write,创建一个新文件(现有的同名文件将被删除)。
‘a’:append,打开现有文件进行读写,如果文件不存在则创建。
‘r+’:类似于‘a’,但文件必须已经存在。
- complevel:{0-9},默认无
指定数据的压缩级别。值 0 或 None 禁用压缩。
- complib:{‘zlib’, ‘lzo’, ‘bzip2’, ‘blosc’},默认 ‘zlib’
指定要使用的压缩库。从 v0.20.2 开始,支持 Blosc 的这些附加压缩器(如果未指定压缩器,则默认为:'blosc:blosclz'):{'blosc:blosclz', 'blosc:lz4', 'blosc:lz4hc', 'blosc:snappy' , 'blosc:zlib', 'blosc:zstd'}。指定不可用的压缩库会引发 ValueError。
- append:布尔值,默认为 False
对于表格格式,将输入数据附加到现有的。
- format:{‘fixed’, ‘table’, 无},默认 ‘fixed’
可能的值:
‘fixed’:固定格式。快速写/读。 Not-appendable,也无法搜索。
‘table’:表格格式。编写为 PyTables 表结构,其性能可能会更差,但允许更灵活的操作,例如搜索/选择数据子集。
如果没有,则检查 pd.get_option(‘io.hdf.default_format’),然后回退到 “fixed”。
- errors:str,默认 ‘strict’
指定如何处理编码和解码错误。有关选项的完整列表,请参阅
open()
的错误参数。- encoding:str,默认 “UTF-8”
- min_itemsize:dict 或 int,可选
将列名映射到列的最小字符串大小。
- nan_rep:任意,可选
如何将空值表示为 str。不允许使用 append=True。
- data_columns:列列表或 True,可选
要创建为 on-disk 查询的索引数据列的列列表,或 True 以使用所有列。默认情况下,只有对象的轴被索引。请参阅通过数据列查询。仅适用于 format='table'。
参数:
例子:
>>> df = pd.DataFrame({'A':[1, 2, 3], 'B':[4, 5, 6]}, ... index=['a', 'b', 'c']) >>> df.to_hdf('data.h5', key='df', mode='w')
我们可以在同一个文件中添加另一个对象:
>>> s = pd.Series([1, 2, 3, 4]) >>> s.to_hdf('data.h5', key='s')
从 HDF 文件中读取:
>>> pd.read_hdf('data.h5', 'df') A B a 1 4 b 2 5 c 3 6 >>> pd.read_hdf('data.h5', 's') 0 1 1 2 2 3 3 4 dtype:int64
相关用法
- Python pandas.DataFrame.to_numpy用法及代码示例
- Python pandas.DataFrame.to_json用法及代码示例
- Python pandas.DataFrame.to_markdown用法及代码示例
- Python pandas.DataFrame.to_sql用法及代码示例
- Python pandas.DataFrame.to_xml用法及代码示例
- Python pandas.DataFrame.to_latex用法及代码示例
- Python pandas.DataFrame.to_pickle用法及代码示例
- Python pandas.DataFrame.to_string用法及代码示例
- Python pandas.DataFrame.to_csv用法及代码示例
- Python pandas.DataFrame.to_dict用法及代码示例
- Python pandas.DataFrame.to_clipboard用法及代码示例
- Python pandas.DataFrame.to_excel用法及代码示例
- Python pandas.DataFrame.to_records用法及代码示例
- Python pandas.DataFrame.to_stata用法及代码示例
- Python pandas.DataFrame.to_parquet用法及代码示例
- Python pandas.DataFrame.to_xarray用法及代码示例
- Python pandas.DataFrame.to_period用法及代码示例
- Python pandas.DataFrame.truncate用法及代码示例
- Python pandas.DataFrame.transpose用法及代码示例
- Python pandas.DataFrame.transform用法及代码示例
注:本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.DataFrame.to_hdf。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。