用法:
Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)
返回一个包含唯一值计数的系列。
结果对象将按降序排列,因此第一个元素是最多的 frequently-occurring 元素。默认情况下排除 NA 值。
- normalize:布尔值,默认为 False
如果为 True,则返回的对象将包含唯一值的相对频率。
- sort:布尔值,默认为真
按频率排序。
- ascending:布尔值,默认为 False
按升序排列。
- bins:整数,可选
与其计数值,不如将它们分组到半开箱中,这对
pd.cut
很方便,仅适用于数字数据。- dropna:布尔值,默认为真
不包括 NaN 的计数。
- Series
参数:
返回:
例子:
>>> index = pd.Index([3, 1, 2, 3, 4, np.nan]) >>> index.value_counts() 3.0 2 1.0 1 2.0 1 4.0 1 dtype:int64
将
normalize
设置为True
时,通过将所有值除以值的总和来返回相对频率。>>> s = pd.Series([3, 1, 2, 3, 4, np.nan]) >>> s.value_counts(normalize=True) 3.0 0.4 1.0 0.2 2.0 0.2 4.0 0.2 dtype:float64
箱子
箱对于从连续变量到分类变量很有用;而不是计算值的唯一幻影,而是将索引划分为指定数量的半开箱。
>>> s.value_counts(bins=3) (0.996, 2.0] 2 (2.0, 3.0] 2 (3.0, 4.0] 1 dtype:int64
dropna
将
dropna
设置为False
我们还可以看到 NaN 索引值。>>> s.value_counts(dropna=False) 3.0 2 1.0 1 2.0 1 4.0 1 NaN 1 dtype:int64
相关用法
- Python pandas.Series.values用法及代码示例
- Python pandas.Series.var用法及代码示例
- Python pandas.Series.view用法及代码示例
- Python pandas.Series.add_prefix用法及代码示例
- Python pandas.Series.map用法及代码示例
- Python pandas.Series.max用法及代码示例
- Python pandas.Series.str.isdecimal用法及代码示例
- Python pandas.Series.str.get用法及代码示例
- Python pandas.Series.to_csv用法及代码示例
- Python pandas.Series.dt.day_name用法及代码示例
- Python pandas.Series.sample用法及代码示例
- Python pandas.Series.head用法及代码示例
- Python pandas.Series.eq用法及代码示例
- Python pandas.Series.plot.line用法及代码示例
- Python pandas.Series.to_pickle用法及代码示例
- Python pandas.Series.between_time用法及代码示例
- Python pandas.Series.reindex_like用法及代码示例
- Python pandas.Series.dt.is_year_end用法及代码示例
- Python pandas.Series.repeat用法及代码示例
- Python pandas.Series.str.replace用法及代码示例
注:本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.Series.value_counts。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。