當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark DataFrame.intersectAll用法及代碼示例


本文簡要介紹 pyspark.sql.DataFrame.intersectAll 的用法。

用法:

DataFrame.intersectAll(other)

返回一個新的 DataFrame ,其中包含此 DataFrame 和另一個 DataFrame 中的行,同時保留重複項。

這相當於 SQL 中的INTERSECT ALL。作為 SQL 中的標準,此函數按位置(而不是按名稱)解析列。

2.4.0 版中的新函數。

例子

>>> df1 = spark.createDataFrame([("a", 1), ("a", 1), ("b", 3), ("c", 4)], ["C1", "C2"])
>>> df2 = spark.createDataFrame([("a", 1), ("a", 1), ("b", 3)], ["C1", "C2"])
>>> df1.intersectAll(df2).sort("C1", "C2").show()
+---+---+
| C1| C2|
+---+---+
|  a|  1|
|  a|  1|
|  b|  3|
+---+---+

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.sql.DataFrame.intersectAll。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。