当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Pandas DataFrame nunique方法用法及代码示例


Pandas DataFrame.nunique(~) 方法计算 DataFrame 中每行或每列的唯一值的数量。

参数

1.axis | intstring

计算唯一值数量的轴:

意义

0"index"

计算每一列。

1"columns"

计算每一行。

默认情况下,axis=0

2. dropna | boolean | optional

是否忽略 NaN 。默认情况下,dropna=True

返回值

Series,保存源 DataFrame 的每行或每列中唯一数字的计数。

例子

考虑以下 DataFrame :

df = pd.DataFrame({"A":[5,5,5], "B":[2,2,3], "C":[1,2,4]})
df



   A  B  C
0  5  2  1
1  5  2  2
2  5  3  4

按列计数

要计算每列中唯一数字的数量:

df.nunique()   # axis=0



A  1
B  2
C  3
dtype: int64

这告诉我们:

  • A 列有 1 个唯一值。

  • B 列有 2 个唯一值。

  • C 列有 3 个唯一值。

按行计数

要计算每行中唯一数字的数量,请设置 axis=1

df.nunique(axis=1)



0    2
1    2
2    3
dtype: int64

这告诉我们:

  • 0 行有 2 个唯一值。

  • 1 行有 2 个唯一值。

  • 2 行有 3 个唯一值。

处理缺失值

考虑以下带有两个缺失值的DataFrame:

df = pd.DataFrame({"A":[np.NaN,1,np.NaN]})
df



   A
0  NaN
1  1.0
2  NaN

默认情况下, dropna=True ,这意味着 NaN 将被忽略:

df.nunique()



A    1
dtype: int64

我们可以通过设置 dropna=False 将它们视为值:

df.nunique(dropna=False)



A    2
dtype: int64

这告诉我们列 A 有 2 个唯一值: NaN1.0

相关用法


注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 Pandas DataFrame | nunique method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。