当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark DatetimeIndex用法及代码示例


本文简要介绍 pyspark.pandas.DatetimeIndex 的用法。

用法:

class pyspark.pandas.DatetimeIndex

datetime64 数据的不可变ndarray-like。

参数

data类似数组(一维),可选

用于构建索引的可选datetime-like 数据。

freqstr 或 pandas 偏移对象,可选

pandas 日期偏移字符串或相应对象之一。可以传递字符串‘infer’,以便在创建时将索引的频率设置为推断频率。

normalize布尔值,默认为 False

在生成日期范围之前将开始/结束日期标准化为午夜。

closed{‘left’, ‘right’},可选

设置是否包含边界上的startend。默认包括两端的边界点。

ambiguous‘infer’, bool-ndarray, ‘NaT’, 默认 ‘raise’

当时钟由于 DST 向后移动时,可能会出现不明确的时间。例如,在欧洲中部时间 (UTC+01) 中,当从 03:00 DST 到 02:00 非 DST 时,当地时间 02:30:00 发生在 00:30:00 UTC 和 01:30:00世界标准时间。在这种情况下,ambiguous 参数指示应如何处理模棱两可的时间。

  • ‘infer’ 将尝试根据订单推断秋季 dst-transition 小时

  • bool-ndarray 其中 True 表示 DST 时间,False 表示非 DST 时间(请注意,此标志仅适用于模棱两可的时间)

  • ‘NaT’将在存在不明确的时间时返回NaT

  • 如果存在不明确的时间,‘raise’ 将引发AmbiguousTimeError。

dayfirst布尔值,默认为 False

如果为 True,则使用第一天的日期解析 data 中的日期。

yearfirst布尔值,默认为 False

如果为 True,则使用年份第一顺序解析 data 中的日期。

dtypenumpy.dtype 或 str,默认无

请注意,唯一允许的 NumPy dtype 是“datetime64[ns]”。

copy布尔值,默认为 False

制作输入 ndarray 的副本。

name标签,默认无

要存储在索引中的名称。

例子

>>> ps.DatetimeIndex(['1970-01-01', '1970-01-01', '1970-01-01'])
DatetimeIndex(['1970-01-01', '1970-01-01', '1970-01-01'], dtype='datetime64[ns]', freq=None)

从一个系列:

>>> from datetime import datetime
>>> s = ps.Series([datetime(2021, 3, 1), datetime(2021, 3, 2)], index=[10, 20])
>>> ps.DatetimeIndex(s)
DatetimeIndex(['2021-03-01', '2021-03-02'], dtype='datetime64[ns]', freq=None)

从索引:

>>> idx = ps.DatetimeIndex(['1970-01-01', '1970-01-01', '1970-01-01'])
>>> ps.DatetimeIndex(idx)
DatetimeIndex(['1970-01-01', '1970-01-01', '1970-01-01'], dtype='datetime64[ns]', freq=None)

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DatetimeIndex。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。