当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Series.reset_index用法及代码示例


本文简要介绍 pyspark.pandas.Series.reset_index 的用法。

用法:

Series.reset_index(level: Union[int, Any, Tuple[Any, …], Sequence[Union[int, Any, Tuple[Any, …]]], None] = None, drop: bool = False, name: Union[Any, Tuple[Any, …], None] = None, inplace: bool = False) → Union[pyspark.pandas.series.Series, pyspark.pandas.frame.DataFrame, None]

生成一个新的 DataFrame 或系列并重置索引。

当索引需要被视为列时,或者当索引没有意义并且需要在另一个操作之前重置为默认值时,这很有用。

参数

levelint、str、tuple 或 list,默认可选

对于具有 MultiIndex 的系列,仅从索引中删除指定的级别。默认情况下删除所有级别。

drop布尔值,默认为 False

只需重置索引,无需将其作为列插入到新的 DataFrame 中。

name对象,可选

用于包含原始系列值的列的名称。默认使用self.name。当 drop 为 True 时,该参数将被忽略。

inplace布尔值,默认为 False

就地修改系列(不要创建新对象)。

返回

系列或DataFrame

drop 为 False(默认值)时,返回 DataFrame。新创建的列将首先出现在 DataFrame 中,然后是原始系列值。当drop 为True 时,返回Series。在任何一种情况下,如果 inplace=True ,都不会返回任何值。

例子

>>> s = ps.Series([1, 2, 3, 4], index=pd.Index(['a', 'b', 'c', 'd'], name='idx'))

生成具有默认索引的DataFrame。

>>> s.reset_index()
  idx  0
0   a  1
1   b  2
2   c  3
3   d  4

要指定新列的名称,请使用 name

>>> s.reset_index(name='values')
  idx  values
0   a       1
1   b       2
2   c       3
3   d       4

使用默认设置 drop 生成新系列为 True。

>>> s.reset_index(drop=True)
0    1
1    2
2    3
3    4
dtype: int64

要在适当位置更新系列,而不生成新的一组 inplace 为 True。请注意,它还需要 drop=True

>>> s.reset_index(inplace=True, drop=True)
>>> s
0    1
1    2
2    3
3    4
dtype: int64

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.reset_index。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。