當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark DataFrame.idxmax用法及代碼示例


本文簡要介紹 pyspark.pandas.DataFrame.idxmax 的用法。

用法:

DataFrame.idxmax(axis: Union[int, str] = 0) → Series

返回請求軸上第一次出現最大值的索引。 NA/空值被排除在外。

注意

此 API 使用 to_pandas() 收集所有具有最大值的行,因為我們假設具有最大值的行數通常很少。

參數

axis0 或 ‘index’

目前隻能設置為0。

返回

Series

例子

>>> psdf = ps.DataFrame({'a': [1, 2, 3, 2],
...                     'b': [4.0, 2.0, 3.0, 1.0],
...                     'c': [300, 200, 400, 200]})
>>> psdf
   a    b    c
0  1  4.0  300
1  2  2.0  200
2  3  3.0  400
3  2  1.0  200
>>> psdf.idxmax()
a    2
b    0
c    2
dtype: int64

對於Multi-column 索引

>>> psdf = ps.DataFrame({'a': [1, 2, 3, 2],
...                     'b': [4.0, 2.0, 3.0, 1.0],
...                     'c': [300, 200, 400, 200]})
>>> psdf.columns = pd.MultiIndex.from_tuples([('a', 'x'), ('b', 'y'), ('c', 'z')])
>>> psdf
   a    b    c
   x    y    z
0  1  4.0  300
1  2  2.0  200
2  3  3.0  400
3  2  1.0  200
>>> psdf.idxmax()
a  x    2
b  y    0
c  z    2
dtype: int64

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.DataFrame.idxmax。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。