当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pandas.DataFrame.value_counts用法及代码示例


用法:

DataFrame.value_counts(subset=None, normalize=False, sort=True, ascending=False, dropna=True)

返回包含 DataFrame 中唯一行数的 Series。

参数

subsetlist-like,可选

计算唯一组合时要使用的列。

normalize布尔值,默认为 False

返回比例而不是频率。

sort布尔值,默认为真

按频率排序。

ascending布尔值,默认为 False

按升序排列。

dropna布尔值,默认为真

不要包括包含 NA 值的行数。

返回

Series

注意

返回的 Series 将有一个 MultiIndex,每个输入列都有一个级别。默认情况下,结果中会省略包含任何 NA 值的行。默认情况下,生成的系列将按降序排列,因此第一个元素是最多的 frequently-occurring 行。

例子

>>> df = pd.DataFrame({'num_legs':[2, 4, 4, 6],
...                    'num_wings':[2, 0, 0, 0]},
...                   index=['falcon', 'dog', 'cat', 'ant'])
>>> df
        num_legs  num_wings
falcon         2          2
dog            4          0
cat            4          0
ant            6          0
>>> df.value_counts()
num_legs  num_wings
4         0            2
2         2            1
6         0            1
dtype:int64
>>> df.value_counts(sort=False)
num_legs  num_wings
2         2            1
4         0            2
6         0            1
dtype:int64
>>> df.value_counts(ascending=True)
num_legs  num_wings
2         2            1
6         0            1
4         0            2
dtype:int64
>>> df.value_counts(normalize=True)
num_legs  num_wings
4         0            0.50
2         2            0.25
6         0            0.25
dtype:float64

dropna 设置为 False 我们还可以计算具有 NA 值的行。

>>> df = pd.DataFrame({'first_name':['John', 'Anne', 'John', 'Beth'],
...                    'middle_name':['Smith', pd.NA, pd.NA, 'Louise']})
>>> df
  first_name middle_name
0       John       Smith
1       Anne        <NA>
2       John        <NA>
3       Beth      Louise
>>> df.value_counts()
first_name  middle_name
Beth        Louise         1
John        Smith          1
dtype:int64
>>> df.value_counts(dropna=False)
first_name  middle_name
Anne        NaN            1
Beth        Louise         1
John        Smith          1
            NaN            1
dtype:int64

相关用法


注:本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.DataFrame.value_counts。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。