當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python Pandas Index.factorize()用法及代碼示例


Python是進行數據分析的一種出色語言,主要是因為以數據為中心的python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。

Pandas Index.factorize()函數將對象編碼為枚舉類型或分類變量。當所有重要的事情是識別不同的值時,此方法對於獲取數組的數字表示很有用。 factorize既可以用作頂層函數pandas.factorize(),也可以作為方法Series.factorize()和Index.factorize()使用。

用法: Index.factorize(sort=False, na_sentinel=-1)

參數:
sort:排序唯一性和隨機標簽以保持關係。
na_sentinel:標記“not found”的值。

返回:整數ndarray,是唯一性的索引器。 uniques.take(labels)將具有與值相同的值。

範例1:采用Index.factorize()函數將給定的Index值編碼為分類形式。

# importing pandas as pd 
import pandas as pd 
  
# Creating the Index 
idx = pd.Index(['Labrador', 'Beagle', 'Labrador', 
                     'Lhasa', 'Husky', 'Beagle']) 
  
# Print the Index 
idx

輸出:

讓我們分解給定的索引。

# convert it into categorical values. 
idx.factorize()

輸出:

正如我們在輸出中看到的,Index.factorize()函數已將Index中的每個標簽轉換為一個類別,並為其分配了數值。

範例2:采用Index.factorize()函數根據其排序順序將索引值分解。

# importing pandas as pd 
import pandas as pd 
  
# Creating the Index 
idx = pd.Index(['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 
               'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec']) 
  
# Print the Index 
idx

輸出:

讓我們根據排序順序將其分解。僅在對索引中的值進行排序後才分配數值。

# Factorize the sorted labels 
idx.factorize(sort = True)

輸出:

正如我們在輸出中看到的那樣,在為索引值分配數值之前,已經對其進行了排序。



相關用法


注:本文由純淨天空篩選整理自Shubham__Ranjan大神的英文原創作品 Python | Pandas Index.factorize()。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。