當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyspark Series.compare用法及代碼示例

本文簡要介紹 pyspark.pandas.Series.compare 的用法。

用法:

Series.compare(other: pyspark.pandas.series.Series, keep_shape: bool = False, keep_equal: bool = False) → pyspark.pandas.frame.DataFrame

與另一個係列進行比較並顯示差異。

參數

otherSeries

要比較的對象。

keep_shape布爾值,默認為 False

如果為真,則保留所有行和列。否則,僅保留具有不同值的那些。

keep_equal布爾值,默認為 False

如果為真,則結果保持相等的值。否則,相等的值顯示為 NaN。

返回

DataFrame

注意

匹配 NaNs 不會顯示為差異。

例子

>>> from pyspark.pandas.config import set_option, reset_option
>>> set_option("compute.ops_on_diff_frames", True)
>>> s1 = ps.Series(["a", "b", "c", "d", "e"])
>>> s2 = ps.Series(["a", "a", "c", "b", "e"])

對齊列上的差異

>>> s1.compare(s2).sort_index()
  self other
1    b     a
3    d     b

保留所有原始行

>>> s1.compare(s2, keep_shape=True).sort_index()
   self other
0  None  None
1     b     a
2  None  None
3     d     b
4  None  None

保留所有原始行以及所有原始值

>>> s1.compare(s2, keep_shape=True, keep_equal=True).sort_index()
  self other
0    a     a
1    b     a
2    c     c
3    d     b
4    e     e
>>> reset_option("compute.ops_on_diff_frames")

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.compare。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。