Python pyspark DataFrame.first用法及代碼示例

本文簡要介紹 pyspark.pandas.DataFrame.first 的用法。

用法: DataFrame.first(offset: Union[str, pandas._libs.tslibs.offsets.DateOffset]) → pyspark.pandas.frame.DataFrame

根據日期偏移選擇時間序列數據的第一個時段。

當 DataFrame 以日期作為索引時，此函數可以根據日期偏移量選擇前幾行。

參數：

offset：str 或 DateOffset: 將選擇的數據的偏移長度。例如，“3D”將顯示前 3 天內具有索引的所有行。

DataFrame: 調用者的子集。

拋出：

TypeError: 如果索引不是 DatetimeIndex

例子：

>>> index = pd.date_range('2018-04-09', periods=4, freq='2D')
>>> psdf = ps.DataFrame({'A': [1, 2, 3, 4]}, index=index)
>>> psdf
            A
2018-04-09  1
2018-04-11  2
2018-04-13  3
2018-04-15  4

獲取過去 3 天的行：

>>> psdf.first('3D')
            A
2018-04-09  1
2018-04-11  2

請注意，返回的是前 3 個日曆日的數據，而不是數據集中觀察到的前 3 天，因此未返回 2018-04-13 的數據。

相關用法

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.first。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

用法:

參數：

返回：

拋出：

例子：