当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark DataFrame.last用法及代码示例


本文简要介绍 pyspark.pandas.DataFrame.last 的用法。

用法:

DataFrame.last(offset: Union[str, pandas._libs.tslibs.offsets.DateOffset]) → pyspark.pandas.frame.DataFrame

根据日期偏移选择时间序列数据的最终期间。

当 DataFrame 以日期作为索引时,此函数可以根据日期偏移量选择最后几行。

参数

offsetstr 或 DateOffset

将选择的数据的偏移长度。例如,“3D”将显示过去 3 天内具有索引的所有行。

返回

DataFrame

调用者的子集。

抛出

TypeError

如果索引不是 DatetimeIndex

例子

>>> index = pd.date_range('2018-04-09', periods=4, freq='2D')
>>> psdf = ps.DataFrame({'A': [1, 2, 3, 4]}, index=index)
>>> psdf
            A
2018-04-09  1
2018-04-11  2
2018-04-13  3
2018-04-15  4

获取过去 3 天的行:

>>> psdf.last('3D')
            A
2018-04-13  3
2018-04-15  4

请注意,返回了最后 3 个日历日的数据,而不是数据集中最后 3 个观察天的数据,因此未返回 2018-04-11 的数据。

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.last。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。