当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Series.mask用法及代码示例


本文简要介绍 pyspark.pandas.Series.mask 的用法。

用法:

Series.mask(cond: pyspark.pandas.series.Series, other: Any = nan) → pyspark.pandas.series.Series

替换条件为 True 的值。

参数

cond布尔系列

cond 为 False 时,保留原始值。如果为 True,则替换为其他对应的值。

other标量,系列

cond 为 True 的条目将替换为来自 other 的相应值。

返回

Series

例子

>>> from pyspark.pandas.config import set_option, reset_option
>>> set_option("compute.ops_on_diff_frames", True)
>>> s1 = ps.Series([0, 1, 2, 3, 4])
>>> s2 = ps.Series([100, 200, 300, 400, 500])
>>> s1.mask(s1 > 0).sort_index()
0    0.0
1    NaN
2    NaN
3    NaN
4    NaN
dtype: float64
>>> s1.mask(s1 > 1, 10).sort_index()
0     0
1     1
2    10
3    10
4    10
dtype: int64
>>> s1.mask(s1 > 1, s1 + 100).sort_index()
0      0
1      1
2    102
3    103
4    104
dtype: int64
>>> s1.mask(s1 > 1, s2).sort_index()
0      0
1      1
2    300
3    400
4    500
dtype: int64
>>> reset_option("compute.ops_on_diff_frames")

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.mask。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。