用法:
Resampler.fillna(method, limit=None)
填充上采样引入的缺失值。
在统计学中,插补是用替换值 [1] 替换缺失数据的过程。重采样数据时,可能会出现缺失值(例如,重采样频率高于原始频率时)。
原始数据中存在的缺失值不会被修改。
- method:{‘pad’, ‘backfill’, ‘ffill’, ‘bfill’, ‘nearest’}
用于填充重采样数据中的空洞的方法
‘pad’ or ‘ffill’:使用先前的有效观察来填补空白(前向填充)。
‘backfill’ or ‘bfill’:使用下一个有效观察来填补空白。
‘nearest’:使用最近的有效观察来填补空白。
- limit:int 可选
要填充多少个连续缺失值的限制。
- 系列或DataFrame
填充缺失值的上采样系列或 DataFrame。
参数:
返回:
参考:
例子:
重采样系列:
>>> s = pd.Series([1, 2, 3], ... index=pd.date_range('20180101', periods=3, freq='h')) >>> s 2018-01-01 00:00:00 1 2018-01-01 01:00:00 2 2018-01-01 02:00:00 3 Freq: H, dtype: int64
在不填充缺失值的情况下,您会得到:
>>> s.resample("30min").asfreq() 2018-01-01 00:00:00 1.0 2018-01-01 00:30:00 NaN 2018-01-01 01:00:00 2.0 2018-01-01 01:30:00 NaN 2018-01-01 02:00:00 3.0 Freq: 30T, dtype: float64
>>> s.resample('30min').fillna("backfill") 2018-01-01 00:00:00 1 2018-01-01 00:30:00 2 2018-01-01 01:00:00 2 2018-01-01 01:30:00 3 2018-01-01 02:00:00 3 Freq: 30T, dtype: int64
>>> s.resample('15min').fillna("backfill", limit=2) 2018-01-01 00:00:00 1.0 2018-01-01 00:15:00 NaN 2018-01-01 00:30:00 2.0 2018-01-01 00:45:00 2.0 2018-01-01 01:00:00 2.0 2018-01-01 01:15:00 NaN 2018-01-01 01:30:00 3.0 2018-01-01 01:45:00 3.0 2018-01-01 02:00:00 3.0 Freq: 15T, dtype: float64
>>> s.resample('30min').fillna("pad") 2018-01-01 00:00:00 1 2018-01-01 00:30:00 1 2018-01-01 01:00:00 2 2018-01-01 01:30:00 2 2018-01-01 02:00:00 3 Freq: 30T, dtype: int64
>>> s.resample('30min').fillna("nearest") 2018-01-01 00:00:00 1 2018-01-01 00:30:00 2 2018-01-01 01:00:00 2 2018-01-01 01:30:00 3 2018-01-01 02:00:00 3 Freq: 30T, dtype: int64
上采样之前存在的缺失值不受影响。
>>> sm = pd.Series([1, None, 3], ... index=pd.date_range('20180101', periods=3, freq='h')) >>> sm 2018-01-01 00:00:00 1.0 2018-01-01 01:00:00 NaN 2018-01-01 02:00:00 3.0 Freq: H, dtype: float64
>>> sm.resample('30min').fillna('backfill') 2018-01-01 00:00:00 1.0 2018-01-01 00:30:00 NaN 2018-01-01 01:00:00 NaN 2018-01-01 01:30:00 3.0 2018-01-01 02:00:00 3.0 Freq: 30T, dtype: float64
>>> sm.resample('30min').fillna('pad') 2018-01-01 00:00:00 1.0 2018-01-01 00:30:00 1.0 2018-01-01 01:00:00 NaN 2018-01-01 01:30:00 NaN 2018-01-01 02:00:00 3.0 Freq: 30T, dtype: float64
>>> sm.resample('30min').fillna('nearest') 2018-01-01 00:00:00 1.0 2018-01-01 00:30:00 NaN 2018-01-01 01:00:00 NaN 2018-01-01 01:30:00 3.0 2018-01-01 02:00:00 3.0 Freq: 30T, dtype: float64
DataFrame 重采样是按列进行的。所有相同的选项都可用。
>>> df = pd.DataFrame({'a': [2, np.nan, 6], 'b': [1, 3, 5]}, ... index=pd.date_range('20180101', periods=3, ... freq='h')) >>> df a b 2018-01-01 00:00:00 2.0 1 2018-01-01 01:00:00 NaN 3 2018-01-01 02:00:00 6.0 5
>>> df.resample('30min').fillna("bfill") a b 2018-01-01 00:00:00 2.0 1 2018-01-01 00:30:00 NaN 3 2018-01-01 01:00:00 NaN 3 2018-01-01 01:30:00 6.0 5 2018-01-01 02:00:00 6.0 5
相关用法
- Python pandas.core.resample.Resampler.nearest用法及代码示例
- Python pandas.core.resample.Resampler.transform用法及代码示例
- Python pandas.core.resample.Resampler.bfill用法及代码示例
- Python pandas.core.resample.Resampler.apply用法及代码示例
- Python pandas.core.resample.Resampler.backfill用法及代码示例
- Python pandas.core.resample.Resampler.mean用法及代码示例
- Python pandas.core.resample.Resampler.pipe用法及代码示例
- Python pandas.core.resample.Resampler.interpolate用法及代码示例
- Python pandas.core.resample.Resampler.aggregate用法及代码示例
- Python pandas.core.groupby.GroupBy.nth用法及代码示例
- Python pandas.core.groupby.SeriesGroupBy.unique用法及代码示例
- Python pandas.core.window.rolling.Window.mean用法及代码示例
- Python pandas.core.groupby.DataFrameGroupBy.hist用法及代码示例
- Python pandas.core.groupby.SeriesGroupBy.nlargest用法及代码示例
- Python pandas.core.window.expanding.Expanding.kurt用法及代码示例
- Python pandas.core.window.expanding.Expanding.sum用法及代码示例
- Python pandas.core.window.expanding.Expanding.median用法及代码示例
- Python pandas.core.window.expanding.Expanding.std用法及代码示例
- Python pandas.core.window.rolling.Window.std用法及代码示例
- Python pandas.core.window.rolling.Rolling.aggregate用法及代码示例
注:本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.core.resample.Resampler.fillna。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。