当前位置: 首页>>编程示例 >>用法及示例精选 >>正文


Python pyspark DataFrame.replace用法及代码示例

本文简要介绍 pyspark.pandas.DataFrame.replace 的用法。

用法:

DataFrame.replace(to_replace: Union[Any, List, Tuple, Dict, None] = None, value: Optional[Any] = None, inplace: bool = False, limit: Optional[int] = None, regex: bool = False, method: str = 'pad') → Optional[pyspark.pandas.frame.DataFrame]

返回一个新的DataFrame,用另一个值替换一个值。

参数

to_replaceint、float、string、list、tuple 或 dict

要替换的值。

valueint、float、string、list 或 tuple

用于替换孔的值。替换值必须是 int、float 或 string。如果 value 是列表或元组,则 value 应与 to_replace 的长度相同。

inplace布尔值,默认为 False

就地填充(不创建新对象)

返回

DataFrame

替换后的对象。

例子

>>> df = ps.DataFrame({"name": ['Ironman', 'Captain America', 'Thor', 'Hulk'],
...                    "weapon": ['Mark-45', 'Shield', 'Mjolnir', 'Smash']},
...                   columns=['name', 'weapon'])
>>> df
              name   weapon
0          Ironman  Mark-45
1  Captain America   Shield
2             Thor  Mjolnir
3             Hulk    Smash

标量 to_replacevalue

>>> df.replace('Ironman', 'War-Machine')
              name   weapon
0      War-Machine  Mark-45
1  Captain America   Shield
2             Thor  Mjolnir
3             Hulk    Smash

to_replacevalue 这样的列表

>>> df.replace(['Ironman', 'Captain America'], ['Rescue', 'Hawkeye'], inplace=True)
>>> df
      name   weapon
0   Rescue  Mark-45
1  Hawkeye   Shield
2     Thor  Mjolnir
3     Hulk    Smash

字典可用于为不同的现有值指定不同的替换值要以这种方式使用字典,值参数应为无

>>> df.replace({'Mjolnir': 'Stormbuster'})
      name       weapon
0   Rescue      Mark-45
1  Hawkeye       Shield
2     Thor  Stormbuster
3     Hulk        Smash

dict可以指定在不同的列中替换不同的值 value参数在这种情况下不应该是None

>>> df.replace({'weapon': 'Mjolnir'}, 'Stormbuster')
      name       weapon
0   Rescue      Mark-45
1  Hawkeye       Shield
2     Thor  Stormbuster
3     Hulk        Smash

嵌套字典 value 参数应该是 None 以这种方式使用嵌套字典

>>> df.replace({'weapon': {'Mjolnir': 'Stormbuster'}})
      name       weapon
0   Rescue      Mark-45
1  Hawkeye       Shield
2     Thor  Stormbuster
3     Hulk        Smash

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.replace。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。