用法:
dask.dataframe.read_hdf(pattern, key, start=0, stop=None, columns=None, chunksize=1000000, sorted_index=False, lock=True, mode='r')
將 HDF 文件讀入 Dask DataFrame
將 hdf 文件讀入 dask 數據幀。此函數類似於
pandas.read_hdf
,不同之處在於它可以從單個大文件、多個文件或同一文件的多個鍵中讀取。- pattern:字符串,pathlib.Path,列表
文件模式(字符串)、pathlib.Path、要讀取的緩衝區或文件路徑列表。可以包含通配符。
- key:商店中的組標識符。可以包含通配符
- start:可選,整數(默認為 0),開始的行號
- stop:可選,整數(默認為無,最後一行),行號為
停在
- columns:列列表,可選
列列表,如果不是 None,將限製返回列(默認為 None)
- chunksize:正整數,可選
每個分區的最大行數(默認為 1000000)。
- sorted_index:布爾值,可選
用於指定輸入 hdf 文件是否具有排序索引的選項(默認為 False)。
- lock:布爾值,可選
使用鎖來防止並發問題的選項(默認為 True)。
- mode:{‘a’, ‘r’, ‘r+’},默認 ‘r’。打開文件時使用的模式。
- ‘r’
隻讀;不能修改任何數據。
- ‘a’
附加;打開現有文件進行讀寫,如果文件不存在,則創建它。
- ‘r+’
它類似於‘a’,但文件必須已經存在。
- dask.DataFrame
參數:
返回:
例子:
加載單個文件
>>> dd.read_hdf('myfile.1.hdf5', '/x')
加載多個文件
>>> dd.read_hdf('myfile.*.hdf5', '/x')
>>> dd.read_hdf(['myfile.1.hdf5', 'myfile.2.hdf5'], '/x')
加載多個數據集
>>> dd.read_hdf('myfile.1.hdf5', '/*')
相關用法
- Python dask.dataframe.read_table用法及代碼示例
- Python dask.dataframe.read_json用法及代碼示例
- Python dask.dataframe.read_fwf用法及代碼示例
- Python dask.dataframe.read_sql_table用法及代碼示例
- Python dask.dataframe.read_parquet用法及代碼示例
- Python dask.dataframe.read_csv用法及代碼示例
- Python dask.dataframe.read_orc用法及代碼示例
- Python dask.dataframe.reshape.get_dummies用法及代碼示例
- Python dask.dataframe.rolling.Rolling.var用法及代碼示例
- Python dask.dataframe.rolling.Rolling.count用法及代碼示例
- Python dask.dataframe.rolling.Rolling.min用法及代碼示例
- Python dask.dataframe.rolling.Rolling.quantile用法及代碼示例
- Python dask.dataframe.rolling.Rolling.std用法及代碼示例
- Python dask.dataframe.rolling.Rolling.sum用法及代碼示例
- Python dask.dataframe.rolling.Rolling.kurt用法及代碼示例
- Python dask.dataframe.rolling.Rolling.mean用法及代碼示例
- Python dask.dataframe.rolling.Rolling.median用法及代碼示例
- Python dask.dataframe.Series.apply用法及代碼示例
- Python dask.dataframe.to_records用法及代碼示例
- Python dask.dataframe.DataFrame.applymap用法及代碼示例
注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.dataframe.read_hdf。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。