當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyspark DataFrame.replace用法及代碼示例

本文簡要介紹 pyspark.pandas.DataFrame.replace 的用法。

用法:

DataFrame.replace(to_replace: Union[Any, List, Tuple, Dict, None] = None, value: Optional[Any] = None, inplace: bool = False, limit: Optional[int] = None, regex: bool = False, method: str = 'pad') → Optional[pyspark.pandas.frame.DataFrame]

返回一個新的DataFrame,用另一個值替換一個值。

參數

to_replaceint、float、string、list、tuple 或 dict

要替換的值。

valueint、float、string、list 或 tuple

用於替換孔的值。替換值必須是 int、float 或 string。如果 value 是列表或元組,則 value 應與 to_replace 的長度相同。

inplace布爾值,默認為 False

就地填充(不創建新對象)

返回

DataFrame

替換後的對象。

例子

>>> df = ps.DataFrame({"name": ['Ironman', 'Captain America', 'Thor', 'Hulk'],
...                    "weapon": ['Mark-45', 'Shield', 'Mjolnir', 'Smash']},
...                   columns=['name', 'weapon'])
>>> df
              name   weapon
0          Ironman  Mark-45
1  Captain America   Shield
2             Thor  Mjolnir
3             Hulk    Smash

標量 to_replacevalue

>>> df.replace('Ironman', 'War-Machine')
              name   weapon
0      War-Machine  Mark-45
1  Captain America   Shield
2             Thor  Mjolnir
3             Hulk    Smash

to_replacevalue 這樣的列表

>>> df.replace(['Ironman', 'Captain America'], ['Rescue', 'Hawkeye'], inplace=True)
>>> df
      name   weapon
0   Rescue  Mark-45
1  Hawkeye   Shield
2     Thor  Mjolnir
3     Hulk    Smash

字典可用於為不同的現有值指定不同的替換值要以這種方式使用字典,值參數應為無

>>> df.replace({'Mjolnir': 'Stormbuster'})
      name       weapon
0   Rescue      Mark-45
1  Hawkeye       Shield
2     Thor  Stormbuster
3     Hulk        Smash

dict可以指定在不同的列中替換不同的值 value參數在這種情況下不應該是None

>>> df.replace({'weapon': 'Mjolnir'}, 'Stormbuster')
      name       weapon
0   Rescue      Mark-45
1  Hawkeye       Shield
2     Thor  Stormbuster
3     Hulk        Smash

嵌套字典 value 參數應該是 None 以這種方式使用嵌套字典

>>> df.replace({'weapon': {'Mjolnir': 'Stormbuster'}})
      name       weapon
0   Rescue      Mark-45
1  Hawkeye       Shield
2     Thor  Stormbuster
3     Hulk        Smash

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.replace。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。