当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Series.idxmax用法及代码示例


本文简要介绍 pyspark.pandas.Series.idxmax 的用法。

用法:

Series.idxmax(skipna: bool = True) → Union[Tuple, Any]

返回最大值的行标签。

如果多个值等于最大值,则返回具有该值的第一行标签。

参数

skipna布尔值,默认为真

排除 NA/空值。如果整个系列为 NA,则结果将为 NA。

返回

index

最大值的标签。

抛出

ValueError

如果系列为空。

例子

>>> s = ps.Series(data=[1, None, 4, 3, 5],
...               index=['A', 'B', 'C', 'D', 'E'])
>>> s
A    1.0
B    NaN
C    4.0
D    3.0
E    5.0
dtype: float64
>>> s.idxmax()
'E'

如果 skipna 为 False 并且数据中有 NA 值,则函数返回 nan

>>> s.idxmax(skipna=False)
nan

如果是多索引,您会得到一个元组:

>>> index = pd.MultiIndex.from_arrays([
...     ['a', 'a', 'b', 'b'], ['c', 'd', 'e', 'f']], names=('first', 'second'))
>>> s = ps.Series(data=[1, None, 4, 5], index=index)
>>> s
first  second
a      c         1.0
       d         NaN
b      e         4.0
       f         5.0
dtype: float64
>>> s.idxmax()
('b', 'f')

如果多个值等于最大值,则返回具有该值的第一行标签。

>>> s = ps.Series([1, 100, 1, 100, 1, 100], index=[10, 3, 5, 2, 1, 8])
>>> s
10      1
3     100
5       1
2     100
1       1
8     100
dtype: int64
>>> s.idxmax()
3

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.idxmax。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。