當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyspark DataFrame.first用法及代碼示例

本文簡要介紹 pyspark.pandas.DataFrame.first 的用法。

用法:

DataFrame.first(offset: Union[str, pandas._libs.tslibs.offsets.DateOffset]) → pyspark.pandas.frame.DataFrame

根據日期偏移選擇時間序列數據的第一個時段。

當 DataFrame 以日期作為索引時,此函數可以根據日期偏移量選擇前幾行。

參數

offsetstr 或 DateOffset

將選擇的數據的偏移長度。例如,“3D”將顯示前 3 天內具有索引的所有行。

返回

DataFrame

調用者的子集。

拋出

TypeError

如果索引不是 DatetimeIndex

例子

>>> index = pd.date_range('2018-04-09', periods=4, freq='2D')
>>> psdf = ps.DataFrame({'A': [1, 2, 3, 4]}, index=index)
>>> psdf
            A
2018-04-09  1
2018-04-11  2
2018-04-13  3
2018-04-15  4

獲取過去 3 天的行:

>>> psdf.first('3D')
            A
2018-04-09  1
2018-04-11  2

請注意,返回的是前 3 個日曆日的數據,而不是數據集中觀察到的前 3 天,因此未返回 2018-04-13 的數據。

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.first。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。