Python pyspark shuffle用法及代碼示例

本文簡要介紹 pyspark.sql.functions.shuffle 的用法。

用法: pyspark.sql.functions.shuffle(col)

集合函數：生成給定數組的隨機排列。

2.4.0 版中的新函數。

參數：

col： Column 或 str: 列或表達式的名稱

注意：

該函數是不確定的。

例子：

>>> df = spark.createDataFrame([([1, 20, 3, 5],), ([1, 20, None, 3],)], ['data'])
>>> df.select(shuffle(df.data).alias('s')).collect()  
[Row(s=[3, 1, 5, 20]), Row(s=[20, None, 3, 1])]

相關用法

Python pyspark shiftleft用法及代碼示例
Python pyspark sha1用法及代碼示例
Python pyspark shiftright用法及代碼示例
Python pyspark shiftrightunsigned用法及代碼示例
Python pyspark sha2用法及代碼示例
Python pyspark session_window用法及代碼示例
Python pyspark second用法及代碼示例
Python pyspark slice用法及代碼示例
Python pyspark size用法及代碼示例
Python pyspark struct用法及代碼示例
Python pyspark spark_partition_id用法及代碼示例
Python pyspark split用法及代碼示例
Python pyspark schema_of_csv用法及代碼示例
Python pyspark sequence用法及代碼示例
Python pyspark sort_array用法及代碼示例
Python pyspark substring用法及代碼示例
Python pyspark sql用法及代碼示例
Python pyspark substring_index用法及代碼示例
Python pyspark schema_of_json用法及代碼示例
Python pyspark sentences用法及代碼示例
Python pyspark soundex用法及代碼示例
Python pyspark create_map用法及代碼示例
Python pyspark date_add用法及代碼示例
Python pyspark DataFrame.to_latex用法及代碼示例
Python pyspark DataStreamReader.schema用法及代碼示例

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.sql.functions.shuffle。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。