当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Series.update用法及代码示例


本文简要介绍 pyspark.pandas.Series.update 的用法。

用法:

Series.update(other: pyspark.pandas.series.Series) → None

使用传递的系列中的非 NA 值修改系列。在索引上对齐。

参数

otherSeries

例子

>>> from pyspark.pandas.config import set_option, reset_option
>>> set_option("compute.ops_on_diff_frames", True)
>>> s = ps.Series([1, 2, 3])
>>> s.update(ps.Series([4, 5, 6]))
>>> s.sort_index()
0    4
1    5
2    6
dtype: int64
>>> s = ps.Series(['a', 'b', 'c'])
>>> s.update(ps.Series(['d', 'e'], index=[0, 2]))
>>> s.sort_index()
0    d
1    b
2    e
dtype: object
>>> s = ps.Series([1, 2, 3])
>>> s.update(ps.Series([4, 5, 6, 7, 8]))
>>> s.sort_index()
0    4
1    5
2    6
dtype: int64
>>> s = ps.Series([1, 2, 3], index=[10, 11, 12])
>>> s
10    1
11    2
12    3
dtype: int64
>>> s.update(ps.Series([4, 5, 6]))
>>> s.sort_index()
10    1
11    2
12    3
dtype: int64
>>> s.update(ps.Series([4, 5, 6], index=[11, 12, 13]))
>>> s.sort_index()
10    1
11    4
12    5
dtype: int64

如果other包含NaNs,则原始系列中的相应值不会更新。

>>> s = ps.Series([1, 2, 3])
>>> s.update(ps.Series([4, np.nan, 6]))
>>> s.sort_index()
0    4.0
1    2.0
2    6.0
dtype: float64
>>> reset_option("compute.ops_on_diff_frames")

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.update。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。