Python pyspark DataFrame.cube用法及代码示例

本文简要介绍 pyspark.sql.DataFrame.cube 的用法。

用法: DataFrame.cube(*cols)

使用指定的列为当前 DataFrame 创建一个多维多维数据集，以便我们可以对它们运行聚合。

1.4.0 版中的新函数。

例子：

>>> df.cube("name", df.age).count().orderBy("name", "age").show()
+-----+----+-----+
| name| age|count|
+-----+----+-----+
| null|null|    2|
| null|   2|    1|
| null|   5|    1|
|Alice|null|    1|
|Alice|   2|    1|
|  Bob|null|    1|
|  Bob|   5|    1|
+-----+----+-----+

相关用法

Python pyspark DataFrame.cumsum用法及代码示例
Python pyspark DataFrame.cummax用法及代码示例
Python pyspark DataFrame.cummin用法及代码示例
Python pyspark DataFrame.cumprod用法及代码示例
Python pyspark DataFrame.copy用法及代码示例
Python pyspark DataFrame.corr用法及代码示例
Python pyspark DataFrame.colRegex用法及代码示例
Python pyspark DataFrame.createOrReplaceGlobalTempView用法及代码示例
Python pyspark DataFrame.collect用法及代码示例
Python pyspark DataFrame.clip用法及代码示例
Python pyspark DataFrame.columns用法及代码示例
Python pyspark DataFrame.crossJoin用法及代码示例
Python pyspark DataFrame.count用法及代码示例
Python pyspark DataFrame.createGlobalTempView用法及代码示例
Python pyspark DataFrame.createTempView用法及代码示例
Python pyspark DataFrame.createOrReplaceTempView用法及代码示例
Python pyspark DataFrame.coalesce用法及代码示例
Python pyspark DataFrame.to_latex用法及代码示例
Python pyspark DataFrame.align用法及代码示例
Python pyspark DataFrame.plot.bar用法及代码示例
Python pyspark DataFrame.to_delta用法及代码示例
Python pyspark DataFrame.quantile用法及代码示例
Python pyspark DataFrame.iloc用法及代码示例
Python pyspark DataFrame.dropDuplicates用法及代码示例
Python pyspark DataFrame.printSchema用法及代码示例

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.sql.DataFrame.cube。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。