当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark DataFrame.between_time用法及代码示例


本文简要介绍 pyspark.pandas.DataFrame.between_time 的用法。

用法:

DataFrame.between_time(start_time: Union[datetime.time, str], end_time: Union[datetime.time, str], include_start: bool = True, include_end: bool = True, axis: Union[int, str] = 0) → pyspark.pandas.frame.DataFrame

选择一天中特定时间之间的值(例如:上午 9:00-9:30)。

通过设置start_time迟于end_time, 你可以得到时间不是两次之间。

参数

start_timedatetime.time 或 str

初始时间作为时间过滤器限制。

end_timedatetime.time 或 str

结束时间作为时间过滤器限制。

include_start布尔值,默认为真

开始时间是否需要包含在结果中。

include_end布尔值,默认为真

结束时间是否需要包含在结果中。

axis{0 或 ‘index’,1 或 ‘columns’},默认 0

确定索引或列值的范围时间。

返回

DataFrame

过滤到指定日期范围的原始对象中的数据。

抛出

TypeError

如果索引不是 DatetimeIndex

例子

>>> idx = pd.date_range('2018-04-09', periods=4, freq='1D20min')
>>> psdf = ps.DataFrame({'A': [1, 2, 3, 4]}, index=idx)
>>> psdf
                     A
2018-04-09 00:00:00  1
2018-04-10 00:20:00  2
2018-04-11 00:40:00  3
2018-04-12 01:00:00  4
>>> psdf.between_time('0:15', '0:45')
                     A
2018-04-10 00:20:00  2
2018-04-11 00:40:00  3

你得到的时间是不是两次之间通过设置start_time晚于end_time

>>> psdf.between_time('0:45', '0:15')
                     A
2018-04-09 00:00:00  1
2018-04-12 01:00:00  4

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.between_time。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。