Python Pandas DataFrame nunique方法用法及代碼示例

Pandas DataFrame.nunique(~) 方法計算 DataFrame 中每行或每列的唯一值的數量。

1.axis | int 或 string

計算唯一值數量的軸：

值	意義
`0` 或 `"index"`	計算每一列。
`1` 或 `"columns"`	計算每一行。

默認情況下，axis=0 。

2. dropna | boolean | optional

是否忽略 NaN 。默認情況下，dropna=True 。

Series，保存源 DataFrame 的每行或每列中唯一數字的計數。

考慮以下 DataFrame ：

df = pd.DataFrame({"A":[5,5,5], "B":[2,2,3], "C":[1,2,4]})
df



   A  B  C
0  5  2  1
1  5  2  2
2  5  3  4

要計算每列中唯一數字的數量：

df.nunique()   # axis=0



A  1
B  2
C  3
dtype: int64

這告訴我們：

要計算每行中唯一數字的數量，請設置 axis=1 ：

df.nunique(axis=1)



0    2
1    2
2    3
dtype: int64

這告訴我們：

考慮以下帶有兩個缺失值的DataFrame：

df = pd.DataFrame({"A":[np.NaN,1,np.NaN]})
df



   A
0  NaN
1  1.0
2  NaN

默認情況下， dropna=True ，這意味著 NaN 將被忽略：

df.nunique()



A    1
dtype: int64

我們可以通過設置 dropna=False 將它們視為值：

df.nunique(dropna=False)



A    2
dtype: int64

這告訴我們列 A 有 2 個唯一值： NaN 和 1.0 。

相關用法

注：本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 Pandas DataFrame | nunique method。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。