当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Index.symmetric_difference用法及代码示例


本文简要介绍 pyspark.pandas.Index.symmetric_difference 的用法。

用法:

Index.symmetric_difference(other: pyspark.pandas.indexes.base.Index, result_name: Union[Any, Tuple[Any, …], None] = None, sort: Optional[bool] = None) → pyspark.pandas.indexes.base.Index

计算两个 Index 对象的对称差。

参数

other索引或类似数组
result_namestr
sort真或无,默认无

是否对结果索引进行排序。 * True:尝试对结果进行排序。 * 无:不对结果进行排序。

返回

symmetric_difference index

注意

symmetric_difference 包含出现在 idx1idx2 但不是同时出现的元素。相当于idx1.difference(idx2) | idx2.difference(idx1) 创建的索引,删除了重复项。

例子

>>> s1 = ps.Series([1, 2, 3, 4], index=[1, 2, 3, 4])
>>> s2 = ps.Series([1, 2, 3, 4], index=[2, 3, 4, 5])
>>> s1.index.symmetric_difference(s2.index)  
Int64Index([5, 1], dtype='int64')

您可以设置结果索引的名称。

>>> s1.index.symmetric_difference(s2.index, result_name='pandas-on-Spark')  
Int64Index([5, 1], dtype='int64', name='pandas-on-Spark')

如果要对结果索引进行排序,可以将 sort 设置为 True

>>> s1.index.symmetric_difference(s2.index, sort=True)
Int64Index([1, 5], dtype='int64')

您还可以使用 ^ 运算符:

>>> s1.index ^ s2.index  
Int64Index([5, 1], dtype='int64')

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Index.symmetric_difference。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。