本文简要介绍
pyspark.pandas.Series.quantile
的用法。用法:
Series.quantile(q: Union[float, Iterable[float]] = 0.5, accuracy: int = 10000) → Union[int, float, bool, str, bytes, decimal.Decimal, datetime.date, datetime.datetime, None, pyspark.pandas.series.Series]
返回给定分位数的值。
注意
与 pandas 不同,pandas-on-Spark 中的分位数是基于近似百分位数计算的近似分位数,因为跨大型数据集计算分位数非常昂贵。
- q:浮点型或类似数组,默认 0.5(50% 分位数)
0 <= q <= 1,要计算的分位数。
- accuracy:整数,可选
近似的默认精度。较大的值意味着更好的准确性。相对误差可以推导出 1.0/accuracy。
- 浮点数或系列
如果当前对象是一个系列并且
q
是一个数组,则将返回一个系列,其中索引为q
,值是分位数,否则将返回一个浮点数。
参数:
返回:
例子:
>>> s = ps.Series([1, 2, 3, 4, 5]) >>> s.quantile(.5) 3.0
>>> (s + 1).quantile(.5) 4.0
>>> s.quantile([.25, .5, .75]) 0.25 2.0 0.50 3.0 0.75 4.0 dtype: float64
>>> (s + 1).quantile([.25, .5, .75]) 0.25 3.0 0.50 4.0 0.75 5.0 dtype: float64
相关用法
- Python pyspark Series.asof用法及代码示例
- Python pyspark Series.to_frame用法及代码示例
- Python pyspark Series.rsub用法及代码示例
- Python pyspark Series.mod用法及代码示例
- Python pyspark Series.str.join用法及代码示例
- Python pyspark Series.str.startswith用法及代码示例
- Python pyspark Series.dt.is_quarter_end用法及代码示例
- Python pyspark Series.dropna用法及代码示例
- Python pyspark Series.sub用法及代码示例
- Python pyspark Series.sum用法及代码示例
- Python pyspark Series.gt用法及代码示例
- Python pyspark Series.iloc用法及代码示例
- Python pyspark Series.explode用法及代码示例
- Python pyspark Series.str.slice_replace用法及代码示例
- Python pyspark Series.dt.is_month_end用法及代码示例
- Python pyspark Series.plot.barh用法及代码示例
- Python pyspark Series.between用法及代码示例
- Python pyspark Series.floordiv用法及代码示例
- Python pyspark Series.describe用法及代码示例
- Python pyspark Series.ndim用法及代码示例
- Python pyspark Series.str.rjust用法及代码示例
- Python pyspark Series.loc用法及代码示例
- Python pyspark Series.add_prefix用法及代码示例
- Python pyspark Series.truediv用法及代码示例
- Python pyspark Series.sem用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.quantile。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。