本文簡要介紹
pyspark.sql.functions.shuffle
的用法。用法:
pyspark.sql.functions.shuffle(col)
集合函數:生成給定數組的隨機排列。
2.4.0 版中的新函數。
- col:
Column
或 str 列或表達式的名稱
- col:
參數:
注意:
該函數是不確定的。
例子:
>>> df = spark.createDataFrame([([1, 20, 3, 5],), ([1, 20, None, 3],)], ['data']) >>> df.select(shuffle(df.data).alias('s')).collect() [Row(s=[3, 1, 5, 20]), Row(s=[20, None, 3, 1])]
相關用法
- Python pyspark shiftleft用法及代碼示例
- Python pyspark sha1用法及代碼示例
- Python pyspark shiftright用法及代碼示例
- Python pyspark shiftrightunsigned用法及代碼示例
- Python pyspark sha2用法及代碼示例
- Python pyspark session_window用法及代碼示例
- Python pyspark second用法及代碼示例
- Python pyspark slice用法及代碼示例
- Python pyspark size用法及代碼示例
- Python pyspark struct用法及代碼示例
- Python pyspark spark_partition_id用法及代碼示例
- Python pyspark split用法及代碼示例
- Python pyspark schema_of_csv用法及代碼示例
- Python pyspark sequence用法及代碼示例
- Python pyspark sort_array用法及代碼示例
- Python pyspark substring用法及代碼示例
- Python pyspark sql用法及代碼示例
- Python pyspark substring_index用法及代碼示例
- Python pyspark schema_of_json用法及代碼示例
- Python pyspark sentences用法及代碼示例
- Python pyspark soundex用法及代碼示例
- Python pyspark create_map用法及代碼示例
- Python pyspark date_add用法及代碼示例
- Python pyspark DataFrame.to_latex用法及代碼示例
- Python pyspark DataStreamReader.schema用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.sql.functions.shuffle。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。