Python pyspark Series.reset_index用法及代码示例

本文简要介绍 pyspark.pandas.Series.reset_index 的用法。

用法: Series.reset_index(level: Union[int, Any, Tuple[Any, …], Sequence[Union[int, Any, Tuple[Any, …]]], None] = None, drop: bool = False, name: Union[Any, Tuple[Any, …], None] = None, inplace: bool = False) → Union[pyspark.pandas.series.Series, pyspark.pandas.frame.DataFrame, None]

生成一个新的 DataFrame 或系列并重置索引。

当索引需要被视为列时，或者当索引没有意义并且需要在另一个操作之前重置为默认值时，这很有用。

参数：

level：int、str、tuple 或 list，默认可选: 对于具有 MultiIndex 的系列，仅从索引中删除指定的级别。默认情况下删除所有级别。
drop：布尔值，默认为 False: 只需重置索引，无需将其作为列插入到新的 DataFrame 中。
name：对象，可选: 用于包含原始系列值的列的名称。默认使用self.name。当 drop 为 True 时，该参数将被忽略。
inplace：布尔值，默认为 False: 就地修改系列(不要创建新对象)。

系列或DataFrame: 当 drop 为 False(默认值)时，返回 DataFrame。新创建的列将首先出现在 DataFrame 中，然后是原始系列值。当drop 为True 时，返回Series。在任何一种情况下，如果 inplace=True ，都不会返回任何值。

例子：

>>> s = ps.Series([1, 2, 3, 4], index=pd.Index(['a', 'b', 'c', 'd'], name='idx'))

生成具有默认索引的DataFrame。

>>> s.reset_index()
  idx  0
0   a  1
1   b  2
2   c  3
3   d  4

要指定新列的名称，请使用 name 。

>>> s.reset_index(name='values')
  idx  values
0   a       1
1   b       2
2   c       3
3   d       4

使用默认设置 drop 生成新系列为 True。

>>> s.reset_index(drop=True)
0    1
1    2
2    3
3    4
dtype: int64

要在适当位置更新系列，而不生成新的一组 inplace 为 True。请注意，它还需要 drop=True 。

>>> s.reset_index(inplace=True, drop=True)
>>> s
0    1
1    2
2    3
3    4
dtype: int64

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.reset_index。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

参数：

返回：

例子：