Python pyspark Series.quantile用法及代碼示例

本文簡要介紹 pyspark.pandas.Series.quantile 的用法。

用法: Series.quantile(q: Union[float, Iterable[float]] = 0.5, accuracy: int = 10000) → Union[int, float, bool, str, bytes, decimal.Decimal, datetime.date, datetime.datetime, None, pyspark.pandas.series.Series]

返回給定分位數的值。

注意

與 pandas 不同，pandas-on-Spark 中的分位數是基於近似百分位數計算的近似分位數，因為跨大型數據集計算分位數非常昂貴。

參數：

q：浮點型或類似數組，默認 0.5(50% 分位數): 0 <= q <= 1，要計算的分位數。
accuracy：整數，可選: 近似的默認精度。較大的值意味著更好的準確性。相對誤差可以推導出 1.0/accuracy。

浮點數或係列: 如果當前對象是一個係列並且q 是一個數組，則將返回一個係列，其中索引為q，值是分位數，否則將返回一個浮點數。

例子：

>>> s = ps.Series([1, 2, 3, 4, 5])
>>> s.quantile(.5)
3.0

>>> (s + 1).quantile(.5)
4.0

>>> s.quantile([.25, .5, .75])
0.25    2.0
0.50    3.0
0.75    4.0
dtype: float64

>>> (s + 1).quantile([.25, .5, .75])
0.25    3.0
0.50    4.0
0.75    5.0
dtype: float64

相關用法

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.quantile。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

用法:

參數：

返回：

例子：