Python pyspark DataFrame.intersectAll用法及代码示例

本文简要介绍 pyspark.sql.DataFrame.intersectAll 的用法。

用法: DataFrame.intersectAll(other)

返回一个新的 DataFrame ，其中包含此 DataFrame 和另一个 DataFrame 中的行，同时保留重复项。

这相当于 SQL 中的INTERSECT ALL。作为 SQL 中的标准，此函数按位置(而不是按名称)解析列。

2.4.0 版中的新函数。

例子：

>>> df1 = spark.createDataFrame([("a", 1), ("a", 1), ("b", 3), ("c", 4)], ["C1", "C2"])
>>> df2 = spark.createDataFrame([("a", 1), ("a", 1), ("b", 3)], ["C1", "C2"])

>>> df1.intersectAll(df2).sort("C1", "C2").show()
+---+---+
| C1| C2|
+---+---+
|  a|  1|
|  a|  1|
|  b|  3|
+---+---+

相关用法

Python pyspark DataFrame.info用法及代码示例
Python pyspark DataFrame.insert用法及代码示例
Python pyspark DataFrame.inputFiles用法及代码示例
Python pyspark DataFrame.iloc用法及代码示例
Python pyspark DataFrame.isnull用法及代码示例
Python pyspark DataFrame.iat用法及代码示例
Python pyspark DataFrame.iterrows用法及代码示例
Python pyspark DataFrame.itertuples用法及代码示例
Python pyspark DataFrame.isna用法及代码示例
Python pyspark DataFrame.idxmin用法及代码示例
Python pyspark DataFrame.iteritems用法及代码示例
Python pyspark DataFrame.isin用法及代码示例
Python pyspark DataFrame.idxmax用法及代码示例
Python pyspark DataFrame.to_latex用法及代码示例
Python pyspark DataFrame.align用法及代码示例
Python pyspark DataFrame.plot.bar用法及代码示例
Python pyspark DataFrame.to_delta用法及代码示例
Python pyspark DataFrame.quantile用法及代码示例
Python pyspark DataFrame.cumsum用法及代码示例
Python pyspark DataFrame.dropDuplicates用法及代码示例
Python pyspark DataFrame.printSchema用法及代码示例
Python pyspark DataFrame.to_table用法及代码示例
Python pyspark DataFrame.rmod用法及代码示例
Python pyspark DataFrame.div用法及代码示例
Python pyspark DataFrame.drop_duplicates用法及代码示例

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.DataFrame.intersectAll。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。