Python dask.dataframe.read_hdf用法及代碼示例

用法: dask.dataframe.read_hdf(pattern, key, start=0, stop=None, columns=None, chunksize=1000000, sorted_index=False, lock=True, mode='r')

將 HDF 文件讀入 Dask DataFrame

將 hdf 文件讀入 dask 數據幀。此函數類似於 pandas.read_hdf ，不同之處在於它可以從單個大文件、多個文件或同一文件的多個鍵中讀取。

pattern：字符串，pathlib.Path，列表

文件模式(字符串)、pathlib.Path、要讀取的緩衝區或文件路徑列表。可以包含通配符。

key：商店中的組標識符。可以包含通配符

start：可選，整數(默認為 0)，開始的行號

stop：可選，整數(默認為無，最後一行)，行號為

停在

columns：列列表，可選

列列表，如果不是 None，將限製返回列(默認為 None)

chunksize：正整數，可選

每個分區的最大行數(默認為 1000000)。

sorted_index：布爾值，可選

用於指定輸入 hdf 文件是否具有排序索引的選項(默認為 False)。

lock：布爾值，可選

使用鎖來防止並發問題的選項(默認為 True)。

mode：{‘a’, ‘r’, ‘r+’}，默認 ‘r’。打開文件時使用的模式。

加載單個文件

>>> dd.read_hdf('myfile.1.hdf5', '/x')

加載多個文件

>>> dd.read_hdf('myfile.*.hdf5', '/x')

>>> dd.read_hdf(['myfile.1.hdf5', 'myfile.2.hdf5'], '/x')

加載多個數據集

>>> dd.read_hdf('myfile.1.hdf5', '/*')

相關用法

注：本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.dataframe.read_hdf。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。