當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark Series.reset_index用法及代碼示例


本文簡要介紹 pyspark.pandas.Series.reset_index 的用法。

用法:

Series.reset_index(level: Union[int, Any, Tuple[Any, …], Sequence[Union[int, Any, Tuple[Any, …]]], None] = None, drop: bool = False, name: Union[Any, Tuple[Any, …], None] = None, inplace: bool = False) → Union[pyspark.pandas.series.Series, pyspark.pandas.frame.DataFrame, None]

生成一個新的 DataFrame 或係列並重置索引。

當索引需要被視為列時,或者當索引沒有意義並且需要在另一個操作之前重置為默認值時,這很有用。

參數

levelint、str、tuple 或 list,默認可選

對於具有 MultiIndex 的係列,僅從索引中刪除指定的級別。默認情況下刪除所有級別。

drop布爾值,默認為 False

隻需重置索引,無需將其作為列插入到新的 DataFrame 中。

name對象,可選

用於包含原始係列值的列的名稱。默認使用self.name。當 drop 為 True 時,該參數將被忽略。

inplace布爾值,默認為 False

就地修改係列(不要創建新對象)。

返回

係列或DataFrame

drop 為 False(默認值)時,返回 DataFrame。新創建的列將首先出現在 DataFrame 中,然後是原始係列值。當drop 為True 時,返回Series。在任何一種情況下,如果 inplace=True ,都不會返回任何值。

例子

>>> s = ps.Series([1, 2, 3, 4], index=pd.Index(['a', 'b', 'c', 'd'], name='idx'))

生成具有默認索引的DataFrame。

>>> s.reset_index()
  idx  0
0   a  1
1   b  2
2   c  3
3   d  4

要指定新列的名稱,請使用 name

>>> s.reset_index(name='values')
  idx  values
0   a       1
1   b       2
2   c       3
3   d       4

使用默認設置 drop 生成新係列為 True。

>>> s.reset_index(drop=True)
0    1
1    2
2    3
3    4
dtype: int64

要在適當位置更新係列,而不生成新的一組 inplace 為 True。請注意,它還需要 drop=True

>>> s.reset_index(inplace=True, drop=True)
>>> s
0    1
1    2
2    3
3    4
dtype: int64

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.reset_index。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。