Python是进行数据分析的一种出色语言,主要是因为以数据为中心的Python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。
在分析数据时,很多时候用户希望查看特定列中的唯一值。 Pandas nunique()用于获取唯一值的计数。
要下载使用的CSV文件,请单击此处。
用法:Series.nunique(dropna=True)
参数:
dropna:如果为True,则排除NULL值
返回类型:整数-列中唯一值的数量。
范例1:使用nunique()
在此示例中,使用nunique()方法获取“团队”列中所有唯一值的数量。
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("employees.csv")
# storing unique value in a variable
unique_value = data["Team"].nunique()
# printing value
print(unique_value)
输出:
返回唯一值数量的输出。
10
范例2:空值处理
在此示例中,将unique()方法返回的数组长度与nunique()方法返回的整数进行比较。
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("employees.csv")
# storing unique value in a variable
arr = data["Team"].unique()
# storing unique value in a variable
unique_value = data["Team"].nunique(dropna = True)
# printing values
print(len(arr), unique_value)
输出:
两种情况下的输出都不相同,因为dropna参数设置为True,因此在计算唯一值时会排除NULL值。
11 10
相关用法
- Python pandas.map()用法及代码示例
- Python Pandas Series.str.len()用法及代码示例
- Python Pandas.factorize()用法及代码示例
- Python Pandas TimedeltaIndex.name用法及代码示例
- Python Pandas dataframe.ne()用法及代码示例
- Python Pandas Series.between()用法及代码示例
- Python Pandas DataFrame.where()用法及代码示例
- Python Pandas Series.add()用法及代码示例
- Python Pandas.pivot_table()用法及代码示例
- Python Pandas Series.mod()用法及代码示例
- Python Pandas Dataframe.at[ ]用法及代码示例
- Python Pandas Dataframe.iat[ ]用法及代码示例
- Python Pandas.pivot()用法及代码示例
- Python Pandas dataframe.mul()用法及代码示例
- Python Pandas.melt()用法及代码示例
注:本文由纯净天空筛选整理自Kartikaybhutani大神的英文原创作品 Python | Pandas Series.nunique()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。