當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python cudf.Series.value_counts用法及代碼示例

用法:

Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)

返回一個包含唯一值計數的係列。

結果對象將按降序排列,因此第一個元素是最多的 frequently-occurring 元素。默認情況下排除 NA 值。

參數

normalize布爾值,默認為 False

如果為 True,則返回的對象將包含唯一值的相對頻率。

sort布爾值,默認為真

按頻率排序。

ascending布爾值,默認為 False

按升序排列。

bins整數,可選

不是計算值,而是將它們分組到半開的箱中,使用數字數據。尚不支持此參數。

dropna布爾值,默認為真

不要包括 NaN 和 None 的計數。

返回

result包含唯一值計數的係列。

例子

>>> import cudf
>>> sr = cudf.Series([1.0, 2.0, 2.0, 3.0, 3.0, 3.0, None])
>>> sr
0     1.0
1     2.0
2     2.0
3     3.0
4     3.0
5     3.0
6    <NA>
dtype: float64
>>> sr.value_counts()
3.0    3
2.0    2
1.0    1
dtype: int32

可以通過傳遞 ascending=True 來更改計數的順序:

>>> sr.value_counts(ascending=True)
1.0    1
2.0    2
3.0    3
dtype: int32

normalize 設置為 True,通過將所有值除以值的總和來返回相對頻率。

>>> sr.value_counts(normalize=True)
3.0    0.500000
2.0    0.333333
1.0    0.166667
dtype: float64

要包括 NA 值計數,請傳遞 dropna=False

>>> sr = cudf.Series([1.0, 2.0, 2.0, 3.0, None, 3.0, 3.0, None])
>>> sr
0     1.0
1     2.0
2     2.0
3     3.0
4    <NA>
5     3.0
6     3.0
7    <NA>
dtype: float64
>>> sr.value_counts(dropna=False)
3.0     3
2.0     2
<NA>    2
1.0     1
dtype: int32

相關用法


注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cudf.Series.value_counts。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。