本文簡要介紹
pyspark.pandas.DataFrame.replace
的用法。用法:
DataFrame.replace(to_replace: Union[Any, List, Tuple, Dict, None] = None, value: Optional[Any] = None, inplace: bool = False, limit: Optional[int] = None, regex: bool = False, method: str = 'pad') → Optional[pyspark.pandas.frame.DataFrame]
返回一個新的DataFrame,用另一個值替換一個值。
- to_replace:int、float、string、list、tuple 或 dict
要替換的值。
- value:int、float、string、list 或 tuple
用於替換孔的值。替換值必須是 int、float 或 string。如果 value 是列表或元組,則 value 應與 to_replace 的長度相同。
- inplace:布爾值,默認為 False
就地填充(不創建新對象)
- DataFrame
替換後的對象。
參數:
返回:
例子:
>>> df = ps.DataFrame({"name": ['Ironman', 'Captain America', 'Thor', 'Hulk'], ... "weapon": ['Mark-45', 'Shield', 'Mjolnir', 'Smash']}, ... columns=['name', 'weapon']) >>> df name weapon 0 Ironman Mark-45 1 Captain America Shield 2 Thor Mjolnir 3 Hulk Smash
標量
to_replace
和value
>>> df.replace('Ironman', 'War-Machine') name weapon 0 War-Machine Mark-45 1 Captain America Shield 2 Thor Mjolnir 3 Hulk Smash
像
to_replace
和value
這樣的列表>>> df.replace(['Ironman', 'Captain America'], ['Rescue', 'Hawkeye'], inplace=True) >>> df name weapon 0 Rescue Mark-45 1 Hawkeye Shield 2 Thor Mjolnir 3 Hulk Smash
字典可用於為不同的現有值指定不同的替換值要以這種方式使用字典,值參數應為無
>>> df.replace({'Mjolnir': 'Stormbuster'}) name weapon 0 Rescue Mark-45 1 Hawkeye Shield 2 Thor Stormbuster 3 Hulk Smash
dict可以指定在不同的列中替換不同的值 value參數在這種情況下不應該是None
>>> df.replace({'weapon': 'Mjolnir'}, 'Stormbuster') name weapon 0 Rescue Mark-45 1 Hawkeye Shield 2 Thor Stormbuster 3 Hulk Smash
嵌套字典 value 參數應該是 None 以這種方式使用嵌套字典
>>> df.replace({'weapon': {'Mjolnir': 'Stormbuster'}}) name weapon 0 Rescue Mark-45 1 Hawkeye Shield 2 Thor Stormbuster 3 Hulk Smash
相關用法
- Python pyspark DataFrame.replace用法及代碼示例
- Python pyspark DataFrame.repartition用法及代碼示例
- Python pyspark DataFrame.repartitionByRange用法及代碼示例
- Python pyspark DataFrame.reindex_like用法及代碼示例
- Python pyspark DataFrame.reset_index用法及代碼示例
- Python pyspark DataFrame.rename用法及代碼示例
- Python pyspark DataFrame.registerTempTable用法及代碼示例
- Python pyspark DataFrame.rename_axis用法及代碼示例
- Python pyspark DataFrame.reindex用法及代碼示例
- Python pyspark DataFrame.rmod用法及代碼示例
- Python pyspark DataFrame.rsub用法及代碼示例
- Python pyspark DataFrame.round用法及代碼示例
- Python pyspark DataFrame.rollup用法及代碼示例
- Python pyspark DataFrame.rank用法及代碼示例
- Python pyspark DataFrame.rmul用法及代碼示例
- Python pyspark DataFrame.rfloordiv用法及代碼示例
- Python pyspark DataFrame.radd用法及代碼示例
- Python pyspark DataFrame.rpow用法及代碼示例
- Python pyspark DataFrame.rtruediv用法及代碼示例
- Python pyspark DataFrame.rdiv用法及代碼示例
- Python pyspark DataFrame.randomSplit用法及代碼示例
- Python pyspark DataFrame.to_latex用法及代碼示例
- Python pyspark DataFrame.align用法及代碼示例
- Python pyspark DataFrame.plot.bar用法及代碼示例
- Python pyspark DataFrame.to_delta用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.replace。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。