當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyspark Series.quantile用法及代碼示例

本文簡要介紹 pyspark.pandas.Series.quantile 的用法。

用法:

Series.quantile(q: Union[float, Iterable[float]] = 0.5, accuracy: int = 10000) → Union[int, float, bool, str, bytes, decimal.Decimal, datetime.date, datetime.datetime, None, pyspark.pandas.series.Series]

返回給定分位數的值。

注意

與 pandas 不同,pandas-on-Spark 中的分位數是基於近似百分位數計算的近似分位數,因為跨大型數據集計算分位數非常昂貴。

參數

q浮點型或類似數組,默認 0.5(50% 分位數)

0 <= q <= 1,要計算的分位數。

accuracy整數,可選

近似的默認精度。較大的值意味著更好的準確性。相對誤差可以推導出 1.0/accuracy。

返回

浮點數或係列

如果當前對象是一個係列並且q 是一個數組,則將返回一個係列,其中索引為q,值是分位數,否則將返回一個浮點數。

例子

>>> s = ps.Series([1, 2, 3, 4, 5])
>>> s.quantile(.5)
3.0
>>> (s + 1).quantile(.5)
4.0
>>> s.quantile([.25, .5, .75])
0.25    2.0
0.50    3.0
0.75    4.0
dtype: float64
>>> (s + 1).quantile([.25, .5, .75])
0.25    3.0
0.50    4.0
0.75    5.0
dtype: float64

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.quantile。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。