用法:
DataFrame.repartition(divisions=None, npartitions=None, partition_size=None, freq=None, force=False)
沿新部門重新分區 DataFrame
- divisions:列表,可選
要使用的分區列表。僅在未指定 npartitions 和 partition_size 時使用。為方便起見,如果給定一個整數,這將推遲到 npartitions,如果給定一個字符串,它將推遲到 partition_size(見下文)
- npartitions:整數,可選
輸出的分區數。僅在未指定 partition_size 時使用。
- partition_size: int or string, optional:
每個分區的最大內存字節數。使用數字或字符串,例如 5MB。如果指定了 npartitions 和 divisions 將被忽略。
警告
此關鍵字參數觸發計算以確定每個分區的內存大小,這可能很昂貴。
- freq:str, pd.Timedelta
對時間序列數據進行分區的時間段,例如
'7D'
或'12h'
或pd.Timedelta(hours=12)
。假設一個日期時間索引。- force:布爾值,默認為 False
允許擴展現有的部門。如果為 False,則新分區的下限和上限必須與舊分區相同。
參數:
注意:
應該指定
divisions
,npartitions
,partition_size
或freq
中的一個。如果不是這種情況,將引發ValueError
。例子:
>>> df = df.repartition(npartitions=10) >>> df = df.repartition(divisions=[0, 5, 10, 20]) >>> df = df.repartition(freq='7d')
相關用法
- Python dask.dataframe.DataFrame.replace用法及代碼示例
- Python dask.dataframe.DataFrame.resample用法及代碼示例
- Python dask.dataframe.DataFrame.rename用法及代碼示例
- Python dask.dataframe.DataFrame.round用法及代碼示例
- Python dask.dataframe.DataFrame.rmul用法及代碼示例
- Python dask.dataframe.DataFrame.rmod用法及代碼示例
- Python dask.dataframe.DataFrame.rfloordiv用法及代碼示例
- Python dask.dataframe.DataFrame.radd用法及代碼示例
- Python dask.dataframe.DataFrame.rpow用法及代碼示例
- Python dask.dataframe.DataFrame.random_split用法及代碼示例
- Python dask.dataframe.DataFrame.rtruediv用法及代碼示例
- Python dask.dataframe.DataFrame.rdiv用法及代碼示例
- Python dask.dataframe.DataFrame.rsub用法及代碼示例
- Python dask.dataframe.DataFrame.applymap用法及代碼示例
- Python dask.dataframe.DataFrame.sub用法及代碼示例
- Python dask.dataframe.DataFrame.mod用法及代碼示例
- Python dask.dataframe.DataFrame.cummin用法及代碼示例
- Python dask.dataframe.DataFrame.truediv用法及代碼示例
- Python dask.dataframe.DataFrame.ne用法及代碼示例
- Python dask.dataframe.DataFrame.partitions用法及代碼示例
注:本文由純淨天空篩選整理自dask.org大神的英文原創作品 dask.dataframe.DataFrame.repartition。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。