当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pandas.Series.value_counts用法及代码示例


用法:

Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)

返回一个包含唯一值计数的系列。

结果对象将按降序排列,因此第一个元素是最多的 frequently-occurring 元素。默认情况下排除 NA 值。

参数

normalize布尔值,默认为 False

如果为 True,则返回的对象将包含唯一值的相对频率。

sort布尔值,默认为真

按频率排序。

ascending布尔值,默认为 False

按升序排列。

bins整数,可选

与其计数值,不如将它们分组到半开箱中,这对 pd.cut 很方便,仅适用于数字数据。

dropna布尔值,默认为真

不包括 NaN 的计数。

返回

Series

例子

>>> index = pd.Index([3, 1, 2, 3, 4, np.nan])
>>> index.value_counts()
3.0    2
1.0    1
2.0    1
4.0    1
dtype:int64

normalize 设置为 True 时,通过将所有值除以值的总和来返回相对频率。

>>> s = pd.Series([3, 1, 2, 3, 4, np.nan])
>>> s.value_counts(normalize=True)
3.0    0.4
1.0    0.2
2.0    0.2
4.0    0.2
dtype:float64

箱子

箱对于从连续变量到分类变量很有用;而不是计算值的唯一幻影,而是将索引划分为指定数量的半开箱。

>>> s.value_counts(bins=3)
(0.996, 2.0]    2
(2.0, 3.0]      2
(3.0, 4.0]      1
dtype:int64

dropna

dropna 设置为 False 我们还可以看到 NaN 索引值。

>>> s.value_counts(dropna=False)
3.0    2
1.0    1
2.0    1
4.0    1
NaN    1
dtype:int64

相关用法


注:本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.Series.value_counts。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。