當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark Series.idxmin用法及代碼示例


本文簡要介紹 pyspark.pandas.Series.idxmin 的用法。

用法:

Series.idxmin(skipna: bool = True) → Union[Tuple, Any]

返回最小值的行標簽。

如果多個值等於最小值,則返回具有該值的第一行標簽。

參數

skipna布爾值,默認為真

排除 NA/空值。如果整個係列為 NA,則結果將為 NA。

返回

index

最小值的標簽。

拋出

ValueError

如果係列為空。

注意

此方法是 ndarray.argmin 的係列版本。該方法返回最小值的標簽,而ndarray.argmin 返回位置。要獲得該位置,請使用 series.values.argmin()

例子

>>> s = ps.Series(data=[1, None, 4, 0],
...               index=['A', 'B', 'C', 'D'])
>>> s
A    1.0
B    NaN
C    4.0
D    0.0
dtype: float64
>>> s.idxmin()
'D'

如果 skipna 為 False 並且數據中有 NA 值,則函數返回 nan

>>> s.idxmin(skipna=False)
nan

如果是多索引,您會得到一個元組:

>>> index = pd.MultiIndex.from_arrays([
...     ['a', 'a', 'b', 'b'], ['c', 'd', 'e', 'f']], names=('first', 'second'))
>>> s = ps.Series(data=[1, None, 4, 0], index=index)
>>> s
first  second
a      c         1.0
       d         NaN
b      e         4.0
       f         0.0
dtype: float64
>>> s.idxmin()
('b', 'f')

如果多個值等於最小值,則返回具有該值的第一行標簽。

>>> s = ps.Series([1, 100, 1, 100, 1, 100], index=[10, 3, 5, 2, 1, 8])
>>> s
10      1
3     100
5       1
2     100
1       1
8     100
dtype: int64
>>> s.idxmin()
10

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.idxmin。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。