當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python Pandas DataFrame nunique方法用法及代碼示例

Pandas DataFrame.nunique(~) 方法計算 DataFrame 中每行或每列的唯一值的數量。

參數

1.axis | intstring

計算唯一值數量的軸:

意義

0"index"

計算每一列。

1"columns"

計算每一行。

默認情況下,axis=0

2. dropna | boolean | optional

是否忽略 NaN 。默認情況下,dropna=True

返回值

Series,保存源 DataFrame 的每行或每列中唯一數字的計數。

例子

考慮以下 DataFrame :

df = pd.DataFrame({"A":[5,5,5], "B":[2,2,3], "C":[1,2,4]})
df



   A  B  C
0  5  2  1
1  5  2  2
2  5  3  4

按列計數

要計算每列中唯一數字的數量:

df.nunique()   # axis=0123
dtype: int64

這告訴我們:

  • A 列有 1 個唯一值。

  • B 列有 2 個唯一值。

  • C 列有 3 個唯一值。

按行計數

要計算每行中唯一數字的數量,請設置 axis=1

df.nunique(axis=1)



0    2
1    2
2    3
dtype: int64

這告訴我們:

  • 0 行有 2 個唯一值。

  • 1 行有 2 個唯一值。

  • 2 行有 3 個唯一值。

處理缺失值

考慮以下帶有兩個缺失值的DataFrame:

df = pd.DataFrame({"A":[np.NaN,1,np.NaN]})
df



   A
0  NaN
1  1.0
2  NaN

默認情況下, dropna=True ,這意味著 NaN 將被忽略:

df.nunique()



A    1
dtype: int64

我們可以通過設置 dropna=False 將它們視為值:

df.nunique(dropna=False)



A    2
dtype: int64

這告訴我們列 A 有 2 個唯一值: NaN1.0

相關用法


注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 Pandas DataFrame | nunique method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。