本文简要介绍
pyspark.pandas.DataFrame.idxmax
的用法。用法:
DataFrame.idxmax(axis: Union[int, str] = 0) → Series
返回请求轴上第一次出现最大值的索引。 NA/空值被排除在外。
注意
此 API 使用
to_pandas()
收集所有具有最大值的行,因为我们假设具有最大值的行数通常很少。- axis:0 或 ‘index’
目前只能设置为0。
- Series
参数:
返回:
例子:
>>> psdf = ps.DataFrame({'a': [1, 2, 3, 2], ... 'b': [4.0, 2.0, 3.0, 1.0], ... 'c': [300, 200, 400, 200]}) >>> psdf a b c 0 1 4.0 300 1 2 2.0 200 2 3 3.0 400 3 2 1.0 200
>>> psdf.idxmax() a 2 b 0 c 2 dtype: int64
对于Multi-column 索引
>>> psdf = ps.DataFrame({'a': [1, 2, 3, 2], ... 'b': [4.0, 2.0, 3.0, 1.0], ... 'c': [300, 200, 400, 200]}) >>> psdf.columns = pd.MultiIndex.from_tuples([('a', 'x'), ('b', 'y'), ('c', 'z')]) >>> psdf a b c x y z 0 1 4.0 300 1 2 2.0 200 2 3 3.0 400 3 2 1.0 200
>>> psdf.idxmax() a x 2 b y 0 c z 2 dtype: int64
相关用法
- Python pyspark DataFrame.idxmin用法及代码示例
- Python pyspark DataFrame.iloc用法及代码示例
- Python pyspark DataFrame.isnull用法及代码示例
- Python pyspark DataFrame.info用法及代码示例
- Python pyspark DataFrame.insert用法及代码示例
- Python pyspark DataFrame.iat用法及代码示例
- Python pyspark DataFrame.iterrows用法及代码示例
- Python pyspark DataFrame.itertuples用法及代码示例
- Python pyspark DataFrame.isna用法及代码示例
- Python pyspark DataFrame.inputFiles用法及代码示例
- Python pyspark DataFrame.iteritems用法及代码示例
- Python pyspark DataFrame.intersectAll用法及代码示例
- Python pyspark DataFrame.isin用法及代码示例
- Python pyspark DataFrame.to_latex用法及代码示例
- Python pyspark DataFrame.align用法及代码示例
- Python pyspark DataFrame.plot.bar用法及代码示例
- Python pyspark DataFrame.to_delta用法及代码示例
- Python pyspark DataFrame.quantile用法及代码示例
- Python pyspark DataFrame.cumsum用法及代码示例
- Python pyspark DataFrame.dropDuplicates用法及代码示例
- Python pyspark DataFrame.printSchema用法及代码示例
- Python pyspark DataFrame.to_table用法及代码示例
- Python pyspark DataFrame.rmod用法及代码示例
- Python pyspark DataFrame.div用法及代码示例
- Python pyspark DataFrame.drop_duplicates用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.idxmax。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。