PySpark DataFrame 的 intersect(~)
方法返回一個新的 PySpark DataFrame,其中包含另一個 PySpark DataFrame 中存在的行。請注意,與 intersectAll(~)
不同,intersect(~)
僅包含一次重複行。
注意
intersect(~)
方法相當於 SQL 中的INTERSECT
語句。
參數
1.other
| PySpark 數據幀
與之執行交集的另一個PySpark DataFrame。
返回值
一個新的 PySpark 數據幀。
例子
考慮以下PySpark DataFrame:
df = spark.createDataFrame([("Alex", 20), ("Bob", 30), ("Cathy", 40)], ["name", "age"])
df.show()
+-----+---+
| name|age|
+-----+---+
| Alex| 20|
| Bob| 30|
|Cathy| 40|
+-----+---+
考慮另一個PySpark DataFrame:
df_other = spark.createDataFrame([("Alex", 20), ("Doge", 30), ("eric", 40)], ["name", "age"])
df_other.show()
+----+---+
|name|age|
+----+---+
|Alex| 20|
|Doge| 30|
|eric| 40|
+----+---+
獲取存在於另一個 PySpark DataFrame 中的 PySpark DataFrame 行
要獲取另一個 PySpark DataFrame 中存在的 PySpark DataFrame 行,請使用 intersect(~)
方法,如下所示:
df_intersect = df.intersect(df_other)
df_intersect.show()
+----+---+
|name|age|
+----+---+
|Alex| 20|
+----+---+
在這裏,我們得到這一行,因為兩個 PySpark DataFrame 都包含這一行。
相關用法
- Python PySpark DataFrame intersectAll方法用法及代碼示例
- Python Pandas DataFrame interpolate方法用法及代碼示例
- Python Pandas DataFrame insert方法用法及代碼示例
- Python Pandas DataFrame infer_objects方法用法及代碼示例
- Python Pandas DataFrame index屬性用法及代碼示例
- Python Pandas DataFrame info方法用法及代碼示例
- Python Pandas DataFrame items方法用法及代碼示例
- Python Pandas DataFrame isin方法用法及代碼示例
- Python Pandas DataFrame idxmin方法用法及代碼示例
- Python Pandas DataFrame iloc屬性用法及代碼示例
- Python Pandas DataFrame idxmax方法用法及代碼示例
- Python Pandas DataFrame iteritems方法用法及代碼示例
- Python Pandas DataFrame isna方法用法及代碼示例
- Python Pandas DataFrame iat屬性用法及代碼示例
- Python Pandas DataFrame itertuples方法用法及代碼示例
- Python Pandas DataFrame iterrows方法用法及代碼示例
- Python Pandas DataFrame isnull方法用法及代碼示例
- Python Pandas DataFrame empty屬性用法及代碼示例
- Python Pandas DataFrame pop方法用法及代碼示例
- Python Pandas DataFrame nsmallest方法用法及代碼示例
- Python Pandas DataFrame sample方法用法及代碼示例
- Python Pandas DataFrame max方法用法及代碼示例
- Python Pandas DataFrame swaplevel方法用法及代碼示例
- Python Pandas DataFrame agg方法用法及代碼示例
- Python Pandas DataFrame copy方法用法及代碼示例
注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 PySpark DataFrame | intersect method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。