当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Series.dt.floor用法及代码示例


本文简要介绍 pyspark.pandas.Series.dt.floor 的用法。

用法:

dt.floor(freq: Union[str, pandas._libs.tslibs.offsets.DateOffset], *args: Any, **kwargs: Any) → ps.Series

对指定频率的数据进行下限运算。

参数

freqstr 或偏移量

将索引设为下限的频率级别。必须是固定频率,例如“S”(秒)而不是“ME”(月末)。

nonexistent‘shift_forward’, ‘shift_backward, ‘NaT’, timedelta, 默认 ‘raise’

由于 DST,时钟向前移动的特定时区不存在不存在的时间。

  • ‘shift_forward’ 将不存在的时间向前移动到最接近的存在时间

  • ‘shift_backward’ 将不存在的时间向后移动到最接近的存在时间

  • ‘NaT’将返回NaT,其中不存在时间

  • timedelta 对象会将不存在的时间移动 timedelta

  • 如果不存在时间,‘raise’将引发NonExistentTimeError

注意

此选项仅适用于 pandas 0.24.0+

返回

Series

具有相同索引的系列。

抛出

ValueError(如果freq无法转换)。

例子

>>> series = ps.Series(pd.date_range('1/1/2018 11:59:00', periods=3, freq='min'))
>>> series
0   2018-01-01 11:59:00
1   2018-01-01 12:00:00
2   2018-01-01 12:01:00
dtype: datetime64[ns]
>>> series.dt.floor("H")
0   2018-01-01 11:00:00
1   2018-01-01 12:00:00
2   2018-01-01 12:00:00
dtype: datetime64[ns]

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.dt.floor。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。