當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark DatetimeIndex用法及代碼示例


本文簡要介紹 pyspark.pandas.DatetimeIndex 的用法。

用法:

class pyspark.pandas.DatetimeIndex

datetime64 數據的不可變ndarray-like。

參數

data類似數組(一維),可選

用於構建索引的可選datetime-like 數據。

freqstr 或 pandas 偏移對象,可選

pandas 日期偏移字符串或相應對象之一。可以傳遞字符串‘infer’,以便在創建時將索引的頻率設置為推斷頻率。

normalize布爾值,默認為 False

在生成日期範圍之前將開始/結束日期標準化為午夜。

closed{‘left’, ‘right’},可選

設置是否包含邊界上的startend。默認包括兩端的邊界點。

ambiguous‘infer’, bool-ndarray, ‘NaT’, 默認 ‘raise’

當時鍾由於 DST 向後移動時,可能會出現不明確的時間。例如,在歐洲中部時間 (UTC+01) 中,當從 03:00 DST 到 02:00 非 DST 時,當地時間 02:30:00 發生在 00:30:00 UTC 和 01:30:00世界標準時間。在這種情況下,ambiguous 參數指示應如何處理模棱兩可的時間。

  • ‘infer’ 將嘗試根據訂單推斷秋季 dst-transition 小時

  • bool-ndarray 其中 True 表示 DST 時間,False 表示非 DST 時間(請注意,此標誌僅適用於模棱兩可的時間)

  • ‘NaT’將在存在不明確的時間時返回NaT

  • 如果存在不明確的時間,‘raise’ 將引發AmbiguousTimeError。

dayfirst布爾值,默認為 False

如果為 True,則使用第一天的日期解析 data 中的日期。

yearfirst布爾值,默認為 False

如果為 True,則使用年份第一順序解析 data 中的日期。

dtypenumpy.dtype 或 str,默認無

請注意,唯一允許的 NumPy dtype 是“datetime64[ns]”。

copy布爾值,默認為 False

製作輸入 ndarray 的副本。

name標簽,默認無

要存儲在索引中的名稱。

例子

>>> ps.DatetimeIndex(['1970-01-01', '1970-01-01', '1970-01-01'])
DatetimeIndex(['1970-01-01', '1970-01-01', '1970-01-01'], dtype='datetime64[ns]', freq=None)

從一個係列:

>>> from datetime import datetime
>>> s = ps.Series([datetime(2021, 3, 1), datetime(2021, 3, 2)], index=[10, 20])
>>> ps.DatetimeIndex(s)
DatetimeIndex(['2021-03-01', '2021-03-02'], dtype='datetime64[ns]', freq=None)

從索引:

>>> idx = ps.DatetimeIndex(['1970-01-01', '1970-01-01', '1970-01-01'])
>>> ps.DatetimeIndex(idx)
DatetimeIndex(['1970-01-01', '1970-01-01', '1970-01-01'], dtype='datetime64[ns]', freq=None)

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DatetimeIndex。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。