当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Pandas Index.factorize()用法及代码示例


Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。

Pandas Index.factorize()函数将对象编码为枚举类型或分类变量。当所有重要的事情是识别不同的值时,此方法对于获取数组的数字表示很有用。 factorize既可以用作顶层函数pandas.factorize(),也可以作为方法Series.factorize()和Index.factorize()使用。

用法: Index.factorize(sort=False, na_sentinel=-1)

参数:
sort:排序唯一性和随机标签以保持关系。
na_sentinel:标记“not found”的值。

返回:整数ndarray,是唯一性的索引器。 uniques.take(labels)将具有与值相同的值。

范例1:采用Index.factorize()函数将给定的Index值编码为分类形式。

# importing pandas as pd 
import pandas as pd 
  
# Creating the Index 
idx = pd.Index(['Labrador', 'Beagle', 'Labrador', 
                     'Lhasa', 'Husky', 'Beagle']) 
  
# Print the Index 
idx

输出:

让我们分解给定的索引。

# convert it into categorical values. 
idx.factorize()

输出:

正如我们在输出中看到的,Index.factorize()函数已将Index中的每个标签转换为一个类别,并为其分配了数值。

范例2:采用Index.factorize()函数根据其排序顺序将索引值分解。

# importing pandas as pd 
import pandas as pd 
  
# Creating the Index 
idx = pd.Index(['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 
               'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec']) 
  
# Print the Index 
idx

输出:

让我们根据排序顺序将其分解。仅在对索引中的值进行排序后才分配数值。

# Factorize the sorted labels 
idx.factorize(sort = True)

输出:

正如我们在输出中看到的那样,在为索引值分配数值之前,已经对其进行了排序。



相关用法


注:本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas Index.factorize()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。