当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pandas.core.groupby.DataFrameGroupBy.value_counts用法及代码示例


用法:

DataFrameGroupBy.value_counts(subset=None, normalize=False, sort=True, ascending=False, dropna=True)

返回包含唯一行计数的系列或数据帧。

参数

subsetlist-like,可选

计算唯一组合时要使用的列。

normalize布尔值,默认为 False

返回比例而不是频率。

sort布尔值,默认为真

按频率排序。

ascending布尔值,默认为 False

按升序排列。

dropna布尔值,默认为真

不要包括包含 NA 值的行数。

返回

Series或DataFrame

如果 groupby as_index 为 True,则为系列,否则为 DataFrame。

注意

  • 如果 groupby as_index 为 True,则返回的 Series 将具有 MultiIndex,每个输入列都有一个级别。

  • 如果 groupby as_index 为 False,则返回的 DataFrame 将有一个带有 value_counts 的附加列。该列标记为‘count’ or ‘proportion’,具体取决于normalize 参数。

默认情况下,结果中会省略包含任何 NA 值的行。

默认情况下,结果将按降序排列,以便每个组的第一个元素是最多的 frequently-occurring 行。

例子

>>> df = pd.DataFrame({
...    'gender':['male', 'male', 'female', 'male', 'female', 'male'],
...    'education':['low', 'medium', 'high', 'low', 'high', 'low'],
...    'country':['US', 'FR', 'US', 'FR', 'FR', 'FR']
... })
>>> df
    gender      education       country
0       male    low         US
1       male    medium      FR
2       female  high        US
3       male    low         FR
4       female  high        FR
5       male    low         FR
>>> df.groupby('gender').value_counts()
gender  education  country
female  high       FR         1
                   US         1
male    low        FR         2
                   US         1
        medium     FR         1
dtype:int64
>>> df.groupby('gender').value_counts(ascending=True)
gender  education  country
female  high       FR         1
                   US         1
male    low        US         1
        medium     FR         1
        low        FR         2
dtype:int64
>>> df.groupby('gender').value_counts(normalize=True)
gender  education  country
female  high       FR         0.50
                   US         0.50
male    low        FR         0.50
                   US         0.25
        medium     FR         0.25
dtype:float64
>>> df.groupby('gender', as_index=False).value_counts()
   gender education country  count
0  female      high      FR      1
1  female      high      US      1
2    male       low      FR      2
3    male       low      US      1
4    male    medium      FR      1
>>> df.groupby('gender', as_index=False).value_counts(normalize=True)
   gender education country  proportion
0  female      high      FR        0.50
1  female      high      US        0.50
2    male       low      FR        0.50
3    male       low      US        0.25
4    male    medium      FR        0.25

相关用法


注:本文由纯净天空筛选整理自pandas.pydata.org大神的英文原创作品 pandas.core.groupby.DataFrameGroupBy.value_counts。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。