Pandas DataFrame.nunique(~)
方法计算 DataFrame 中每行或每列的唯一值的数量。
参数
1.axis
| int
或 string
计算唯一值数量的轴:
值 |
意义 |
---|---|
|
计算每一列。 |
|
计算每一行。 |
默认情况下,axis=0
。
2. dropna
| boolean
| optional
是否忽略 NaN
。默认情况下,dropna=True
。
返回值
Series
,保存源 DataFrame 的每行或每列中唯一数字的计数。
例子
考虑以下 DataFrame :
df = pd.DataFrame({"A":[5,5,5], "B":[2,2,3], "C":[1,2,4]})
df
A B C
0 5 2 1
1 5 2 2
2 5 3 4
按列计数
要计算每列中唯一数字的数量:
df.nunique() # axis=0
A 1
B 2
C 3
dtype: int64
这告诉我们:
-
A
列有 1 个唯一值。 -
B
列有 2 个唯一值。 -
C
列有 3 个唯一值。
按行计数
要计算每行中唯一数字的数量,请设置 axis=1
:
df.nunique(axis=1)
0 2
1 2
2 3
dtype: int64
这告诉我们:
-
0
行有 2 个唯一值。 -
1
行有 2 个唯一值。 -
2
行有 3 个唯一值。
处理缺失值
考虑以下带有两个缺失值的DataFrame:
df = pd.DataFrame({"A":[np.NaN,1,np.NaN]})
df
A
0 NaN
1 1.0
2 NaN
默认情况下, dropna=True
,这意味着 NaN
将被忽略:
df.nunique()
A 1
dtype: int64
我们可以通过设置 dropna=False
将它们视为值:
df.nunique(dropna=False)
A 2
dtype: int64
这告诉我们列 A
有 2 个唯一值: NaN
和 1.0
。
相关用法
- Python Pandas DataFrame nsmallest方法用法及代码示例
- Python Pandas DataFrame notna方法用法及代码示例
- Python Pandas DataFrame ne方法用法及代码示例
- Python Pandas DataFrame ndim属性用法及代码示例
- Python Pandas DataFrame nlargest方法用法及代码示例
- Python Pandas DataFrame empty属性用法及代码示例
- Python Pandas DataFrame pop方法用法及代码示例
- Python Pandas DataFrame sample方法用法及代码示例
- Python Pandas DataFrame items方法用法及代码示例
- Python Pandas DataFrame max方法用法及代码示例
- Python Pandas DataFrame swaplevel方法用法及代码示例
- Python Pandas DataFrame agg方法用法及代码示例
- Python Pandas DataFrame copy方法用法及代码示例
- Python Pandas DataFrame pow方法用法及代码示例
- Python Pandas DataFrame insert方法用法及代码示例
- Python Pandas DataFrame lt方法用法及代码示例
- Python Pandas DataFrame all方法用法及代码示例
- Python Pandas DataFrame unstack方法用法及代码示例
- Python Pandas DataFrame mean方法用法及代码示例
- Python PySpark DataFrame filter方法用法及代码示例
- Python Pandas DataFrame tz_convert方法用法及代码示例
- Python Pandas DataFrame isin方法用法及代码示例
- Python PySpark DataFrame collect方法用法及代码示例
- Python PySpark DataFrame intersect方法用法及代码示例
- Python PySpark DataFrame dtypes属性用法及代码示例
注:本文由纯净天空筛选整理自Isshin Inada大神的英文原创作品 Pandas DataFrame | nunique method。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。