當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark range用法及代碼示例


本文簡要介紹 pyspark.pandas.range 的用法。

用法:

pyspark.pandas.range(start: int, end: Optional[int] = None, step: int = 1, num_partitions: Optional[int] = None) → pyspark.pandas.frame.DataFrame

創建一個包含一定範圍數字的DataFrame。

生成的 DataFrame 有一個名為 id 的 int64 列,包含從 startend(不包括)範圍內的元素,步長 值為 step 。如果隻指定了第一個參數(即start),我們將其視為結束值,起始值為0。

這類似於SparkSession中的範圍函數,主要用於測試。

參數

startint

起始值(含)

end整數,可選

最終值(不包括)

stepint,可選,默認1

增量步驟

num_partitions整數,可選

DataFrame的分區數量

返回

DataFrame

例子

當指定第一個參數時,我們會生成一個範圍內的值,直到該數字為止。

>>> ps.range(5)
   id
0   0
1   1
2   2
3   3
4   4

指定 start、end 和 step 時:

>>> ps.range(start = 100, end = 200, step = 20)
    id
0  100
1  120
2  140
3  160
4  180

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.range。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。