本文简要介绍
pyspark.pandas.DataFrame.replace
的用法。用法:
DataFrame.replace(to_replace: Union[Any, List, Tuple, Dict, None] = None, value: Optional[Any] = None, inplace: bool = False, limit: Optional[int] = None, regex: bool = False, method: str = 'pad') → Optional[pyspark.pandas.frame.DataFrame]
返回一个新的DataFrame,用另一个值替换一个值。
- to_replace:int、float、string、list、tuple 或 dict
要替换的值。
- value:int、float、string、list 或 tuple
用于替换孔的值。替换值必须是 int、float 或 string。如果 value 是列表或元组,则 value 应与 to_replace 的长度相同。
- inplace:布尔值,默认为 False
就地填充(不创建新对象)
- DataFrame
替换后的对象。
参数:
返回:
例子:
>>> df = ps.DataFrame({"name": ['Ironman', 'Captain America', 'Thor', 'Hulk'], ... "weapon": ['Mark-45', 'Shield', 'Mjolnir', 'Smash']}, ... columns=['name', 'weapon']) >>> df name weapon 0 Ironman Mark-45 1 Captain America Shield 2 Thor Mjolnir 3 Hulk Smash
标量
to_replace
和value
>>> df.replace('Ironman', 'War-Machine') name weapon 0 War-Machine Mark-45 1 Captain America Shield 2 Thor Mjolnir 3 Hulk Smash
像
to_replace
和value
这样的列表>>> df.replace(['Ironman', 'Captain America'], ['Rescue', 'Hawkeye'], inplace=True) >>> df name weapon 0 Rescue Mark-45 1 Hawkeye Shield 2 Thor Mjolnir 3 Hulk Smash
字典可用于为不同的现有值指定不同的替换值要以这种方式使用字典,值参数应为无
>>> df.replace({'Mjolnir': 'Stormbuster'}) name weapon 0 Rescue Mark-45 1 Hawkeye Shield 2 Thor Stormbuster 3 Hulk Smash
dict可以指定在不同的列中替换不同的值 value参数在这种情况下不应该是None
>>> df.replace({'weapon': 'Mjolnir'}, 'Stormbuster') name weapon 0 Rescue Mark-45 1 Hawkeye Shield 2 Thor Stormbuster 3 Hulk Smash
嵌套字典 value 参数应该是 None 以这种方式使用嵌套字典
>>> df.replace({'weapon': {'Mjolnir': 'Stormbuster'}}) name weapon 0 Rescue Mark-45 1 Hawkeye Shield 2 Thor Stormbuster 3 Hulk Smash
相关用法
- Python pyspark DataFrame.replace用法及代码示例
- Python pyspark DataFrame.repartition用法及代码示例
- Python pyspark DataFrame.repartitionByRange用法及代码示例
- Python pyspark DataFrame.reindex_like用法及代码示例
- Python pyspark DataFrame.reset_index用法及代码示例
- Python pyspark DataFrame.rename用法及代码示例
- Python pyspark DataFrame.registerTempTable用法及代码示例
- Python pyspark DataFrame.rename_axis用法及代码示例
- Python pyspark DataFrame.reindex用法及代码示例
- Python pyspark DataFrame.rmod用法及代码示例
- Python pyspark DataFrame.rsub用法及代码示例
- Python pyspark DataFrame.round用法及代码示例
- Python pyspark DataFrame.rollup用法及代码示例
- Python pyspark DataFrame.rank用法及代码示例
- Python pyspark DataFrame.rmul用法及代码示例
- Python pyspark DataFrame.rfloordiv用法及代码示例
- Python pyspark DataFrame.radd用法及代码示例
- Python pyspark DataFrame.rpow用法及代码示例
- Python pyspark DataFrame.rtruediv用法及代码示例
- Python pyspark DataFrame.rdiv用法及代码示例
- Python pyspark DataFrame.randomSplit用法及代码示例
- Python pyspark DataFrame.to_latex用法及代码示例
- Python pyspark DataFrame.align用法及代码示例
- Python pyspark DataFrame.plot.bar用法及代码示例
- Python pyspark DataFrame.to_delta用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.replace。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。