当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Series.first用法及代码示例


本文简要介绍 pyspark.pandas.Series.first 的用法。

用法:

Series.first(offset: Union[str, pandas._libs.tslibs.offsets.DateOffset]) → pyspark.pandas.series.Series

根据日期偏移选择时间序列数据的第一个时段。

当有一个以日期为索引的系列时,此函数可以根据日期偏移选择前几个元素。

参数

offsetstr 或 DateOffset

将选择的数据的偏移长度。例如,“3D”将显示前 3 天内具有索引的所有行。

返回

Series

调用者的子集。

抛出

TypeError

如果索引不是 DatetimeIndex

例子

>>> index = pd.date_range('2018-04-09', periods=4, freq='2D')
>>> psser = ps.Series([1, 2, 3, 4], index=index)
>>> psser
2018-04-09    1
2018-04-11    2
2018-04-13    3
2018-04-15    4
dtype: int64

获取前 3 天的行:

>>> psser.first('3D')
2018-04-09    1
2018-04-11    2
dtype: int64

请注意,返回的是前 3 个日历日的数据,而不是数据集中观察到的前 3 天,因此未返回 2018-04-13 的数据。

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.first。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。