本文簡要介紹
pyspark.pandas.Series.map
的用法。用法:
Series.map(arg: Union[Dict, Callable]) → pyspark.pandas.series.Series
根據輸入對應關係映射 Series 的值。
用於將 Series 中的每個值替換為另一個值,該值可能源自函數
dict
。注意
確保字典的大小不會很大,因為它可能會降低性能或由於 Spark 中的巨大表達式而拋出 OutOfMemoryError。在這種情況下,請將輸入視為函數作為替代方案。
- arg:函數或字典
映射對應。
- Series
與調用者相同的索引。
參數:
返回:
注意:
當
arg
是字典時, Series 中不在字典中的值(作為鍵)將轉換為None
。但是,如果字典是定義__missing__
的dict
子類(即提供默認值的方法),則使用此默認值而不是None
。例子:
>>> s = ps.Series(['cat', 'dog', None, 'rabbit']) >>> s 0 cat 1 dog 2 None 3 rabbit dtype: object
map
接受dict
。在dict
中找不到的值將轉換為None
,除非字典具有默認值(例如defaultdict
):>>> s.map({'cat': 'kitten', 'dog': 'puppy'}) 0 kitten 1 puppy 2 None 3 None dtype: object
它還接受一個函數:
>>> def format(x) -> str: ... return 'I am a {}'.format(x)
>>> s.map(format) 0 I am a cat 1 I am a dog 2 I am a None 3 I am a rabbit dtype: object
相關用法
- Python pyspark Series.mask用法及代碼示例
- Python pyspark Series.mad用法及代碼示例
- Python pyspark Series.max用法及代碼示例
- Python pyspark Series.mod用法及代碼示例
- Python pyspark Series.mode用法及代碼示例
- Python pyspark Series.mul用法及代碼示例
- Python pyspark Series.mean用法及代碼示例
- Python pyspark Series.median用法及代碼示例
- Python pyspark Series.min用法及代碼示例
- Python pyspark Series.asof用法及代碼示例
- Python pyspark Series.to_frame用法及代碼示例
- Python pyspark Series.rsub用法及代碼示例
- Python pyspark Series.str.join用法及代碼示例
- Python pyspark Series.str.startswith用法及代碼示例
- Python pyspark Series.dt.is_quarter_end用法及代碼示例
- Python pyspark Series.dropna用法及代碼示例
- Python pyspark Series.sub用法及代碼示例
- Python pyspark Series.sum用法及代碼示例
- Python pyspark Series.gt用法及代碼示例
- Python pyspark Series.iloc用法及代碼示例
- Python pyspark Series.explode用法及代碼示例
- Python pyspark Series.str.slice_replace用法及代碼示例
- Python pyspark Series.dt.is_month_end用法及代碼示例
- Python pyspark Series.plot.barh用法及代碼示例
- Python pyspark Series.between用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.map。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。