本文簡要介紹
pyspark.pandas.Series.quantile
的用法。用法:
Series.quantile(q: Union[float, Iterable[float]] = 0.5, accuracy: int = 10000) → Union[int, float, bool, str, bytes, decimal.Decimal, datetime.date, datetime.datetime, None, pyspark.pandas.series.Series]
返回給定分位數的值。
注意
與 pandas 不同,pandas-on-Spark 中的分位數是基於近似百分位數計算的近似分位數,因為跨大型數據集計算分位數非常昂貴。
- q:浮點型或類似數組,默認 0.5(50% 分位數)
0 <= q <= 1,要計算的分位數。
- accuracy:整數,可選
近似的默認精度。較大的值意味著更好的準確性。相對誤差可以推導出 1.0/accuracy。
- 浮點數或係列
如果當前對象是一個係列並且
q
是一個數組,則將返回一個係列,其中索引為q
,值是分位數,否則將返回一個浮點數。
參數:
返回:
例子:
>>> s = ps.Series([1, 2, 3, 4, 5]) >>> s.quantile(.5) 3.0
>>> (s + 1).quantile(.5) 4.0
>>> s.quantile([.25, .5, .75]) 0.25 2.0 0.50 3.0 0.75 4.0 dtype: float64
>>> (s + 1).quantile([.25, .5, .75]) 0.25 3.0 0.50 4.0 0.75 5.0 dtype: float64
相關用法
- Python pyspark Series.asof用法及代碼示例
- Python pyspark Series.to_frame用法及代碼示例
- Python pyspark Series.rsub用法及代碼示例
- Python pyspark Series.mod用法及代碼示例
- Python pyspark Series.str.join用法及代碼示例
- Python pyspark Series.str.startswith用法及代碼示例
- Python pyspark Series.dt.is_quarter_end用法及代碼示例
- Python pyspark Series.dropna用法及代碼示例
- Python pyspark Series.sub用法及代碼示例
- Python pyspark Series.sum用法及代碼示例
- Python pyspark Series.gt用法及代碼示例
- Python pyspark Series.iloc用法及代碼示例
- Python pyspark Series.explode用法及代碼示例
- Python pyspark Series.str.slice_replace用法及代碼示例
- Python pyspark Series.dt.is_month_end用法及代碼示例
- Python pyspark Series.plot.barh用法及代碼示例
- Python pyspark Series.between用法及代碼示例
- Python pyspark Series.floordiv用法及代碼示例
- Python pyspark Series.describe用法及代碼示例
- Python pyspark Series.ndim用法及代碼示例
- Python pyspark Series.str.rjust用法及代碼示例
- Python pyspark Series.loc用法及代碼示例
- Python pyspark Series.add_prefix用法及代碼示例
- Python pyspark Series.truediv用法及代碼示例
- Python pyspark Series.sem用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.quantile。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。