本文簡要介紹
pyspark.pandas.Series.median
的用法。用法:
Series.median(axis: Union[int, str, None] = None, numeric_only: bool = None, accuracy: int = 10000) → Union[int, float, bool, str, bytes, decimal.Decimal, datetime.date, datetime.datetime, None, pyspark.pandas.series.Series]
返回請求軸的值的中值。
注意
與 pandas 不同,pandas-on-Spark 中的中位數是基於近似百分位數計算的近似中位數,因為在大型數據集上計算中位數非常昂貴。
- axis:{索引 (0), 列 (1)}
要應用的函數的軸。
- numeric_only:布爾值,默認無
僅包括 float、int、boolean 列。不支持 False。這個參數主要是為了pandas的兼容性。
- accuracy:整數,可選
近似的默認精度。較大的值意味著更好的準確性。相對誤差可以推導出 1.0/accuracy。
- median:標量或係列
參數:
返回:
例子:
>>> df = ps.DataFrame({ ... 'a': [24., 21., 25., 33., 26.], 'b': [1, 2, 3, 4, 5]}, columns=['a', 'b']) >>> df a b 0 24.0 1 1 21.0 2 2 25.0 3 3 33.0 4 4 26.0 5
在數據幀上:
>>> df.median() a 25.0 b 3.0 dtype: float64
在一個係列上:
>>> df['a'].median() 25.0 >>> (df['b'] + 100).median() 103.0
對於多索引列,
>>> df.columns = pd.MultiIndex.from_tuples([('x', 'a'), ('y', 'b')]) >>> df x y a b 0 24.0 1 1 21.0 2 2 25.0 3 3 33.0 4 4 26.0 5
在數據幀上:
>>> df.median() x a 25.0 y b 3.0 dtype: float64
>>> df.median(axis=1) 0 12.5 1 11.5 2 14.0 3 18.5 4 15.5 dtype: float64
在一個係列上:
>>> df[('x', 'a')].median() 25.0 >>> (df[('y', 'b')] + 100).median() 103.0
相關用法
- Python pyspark Series.mean用法及代碼示例
- Python pyspark Series.mod用法及代碼示例
- Python pyspark Series.mode用法及代碼示例
- Python pyspark Series.mul用法及代碼示例
- Python pyspark Series.mask用法及代碼示例
- Python pyspark Series.min用法及代碼示例
- Python pyspark Series.mad用法及代碼示例
- Python pyspark Series.map用法及代碼示例
- Python pyspark Series.max用法及代碼示例
- Python pyspark Series.asof用法及代碼示例
- Python pyspark Series.to_frame用法及代碼示例
- Python pyspark Series.rsub用法及代碼示例
- Python pyspark Series.str.join用法及代碼示例
- Python pyspark Series.str.startswith用法及代碼示例
- Python pyspark Series.dt.is_quarter_end用法及代碼示例
- Python pyspark Series.dropna用法及代碼示例
- Python pyspark Series.sub用法及代碼示例
- Python pyspark Series.sum用法及代碼示例
- Python pyspark Series.gt用法及代碼示例
- Python pyspark Series.iloc用法及代碼示例
- Python pyspark Series.explode用法及代碼示例
- Python pyspark Series.str.slice_replace用法及代碼示例
- Python pyspark Series.dt.is_month_end用法及代碼示例
- Python pyspark Series.plot.barh用法及代碼示例
- Python pyspark Series.between用法及代碼示例
注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.median。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。