Pandas DataFrame.nunique(~)
方法計算 DataFrame 中每行或每列的唯一值的數量。
參數
1.axis
| int
或 string
計算唯一值數量的軸:
值 |
意義 |
---|---|
|
計算每一列。 |
|
計算每一行。 |
默認情況下,axis=0
。
2. dropna
| boolean
| optional
是否忽略 NaN
。默認情況下,dropna=True
。
返回值
Series
,保存源 DataFrame 的每行或每列中唯一數字的計數。
例子
考慮以下 DataFrame :
df = pd.DataFrame({"A":[5,5,5], "B":[2,2,3], "C":[1,2,4]})
df
A B C
0 5 2 1
1 5 2 2
2 5 3 4
按列計數
要計算每列中唯一數字的數量:
df.nunique() # axis=0
A 1
B 2
C 3
dtype: int64
這告訴我們:
-
A
列有 1 個唯一值。 -
B
列有 2 個唯一值。 -
C
列有 3 個唯一值。
按行計數
要計算每行中唯一數字的數量,請設置 axis=1
:
df.nunique(axis=1)
0 2
1 2
2 3
dtype: int64
這告訴我們:
-
0
行有 2 個唯一值。 -
1
行有 2 個唯一值。 -
2
行有 3 個唯一值。
處理缺失值
考慮以下帶有兩個缺失值的DataFrame:
df = pd.DataFrame({"A":[np.NaN,1,np.NaN]})
df
A
0 NaN
1 1.0
2 NaN
默認情況下, dropna=True
,這意味著 NaN
將被忽略:
df.nunique()
A 1
dtype: int64
我們可以通過設置 dropna=False
將它們視為值:
df.nunique(dropna=False)
A 2
dtype: int64
這告訴我們列 A
有 2 個唯一值: NaN
和 1.0
。
相關用法
- Python Pandas DataFrame nsmallest方法用法及代碼示例
- Python Pandas DataFrame notna方法用法及代碼示例
- Python Pandas DataFrame ne方法用法及代碼示例
- Python Pandas DataFrame ndim屬性用法及代碼示例
- Python Pandas DataFrame nlargest方法用法及代碼示例
- Python Pandas DataFrame empty屬性用法及代碼示例
- Python Pandas DataFrame pop方法用法及代碼示例
- Python Pandas DataFrame sample方法用法及代碼示例
- Python Pandas DataFrame items方法用法及代碼示例
- Python Pandas DataFrame max方法用法及代碼示例
- Python Pandas DataFrame swaplevel方法用法及代碼示例
- Python Pandas DataFrame agg方法用法及代碼示例
- Python Pandas DataFrame copy方法用法及代碼示例
- Python Pandas DataFrame pow方法用法及代碼示例
- Python Pandas DataFrame insert方法用法及代碼示例
- Python Pandas DataFrame lt方法用法及代碼示例
- Python Pandas DataFrame all方法用法及代碼示例
- Python Pandas DataFrame unstack方法用法及代碼示例
- Python Pandas DataFrame mean方法用法及代碼示例
- Python PySpark DataFrame filter方法用法及代碼示例
- Python Pandas DataFrame tz_convert方法用法及代碼示例
- Python Pandas DataFrame isin方法用法及代碼示例
- Python PySpark DataFrame collect方法用法及代碼示例
- Python PySpark DataFrame intersect方法用法及代碼示例
- Python PySpark DataFrame dtypes屬性用法及代碼示例
注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 Pandas DataFrame | nunique method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。