Python是進行數據分析的一種出色語言,主要是因為以數據為中心的python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。
Pandas Index.factorize()
函數將對象編碼為枚舉類型或分類變量。當所有重要的事情是識別不同的值時,此方法對於獲取數組的數字表示很有用。 factorize既可以用作頂層函數pandas.factorize(),也可以作為方法Series.factorize()和Index.factorize()使用。
用法: Index.factorize(sort=False, na_sentinel=-1)
參數:
sort:排序唯一性和隨機標簽以保持關係。
na_sentinel:標記“not found”的值。
返回:整數ndarray,是唯一性的索引器。 uniques.take(labels)將具有與值相同的值。
範例1:采用Index.factorize()
函數將給定的Index值編碼為分類形式。
# importing pandas as pd
import pandas as pd
# Creating the Index
idx = pd.Index(['Labrador', 'Beagle', 'Labrador',
'Lhasa', 'Husky', 'Beagle'])
# Print the Index
idx
輸出:
讓我們分解給定的索引。
# convert it into categorical values.
idx.factorize()
輸出:
正如我們在輸出中看到的,Index.factorize()
函數已將Index中的每個標簽轉換為一個類別,並為其分配了數值。
範例2:采用Index.factorize()
函數根據其排序順序將索引值分解。
# importing pandas as pd
import pandas as pd
# Creating the Index
idx = pd.Index(['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun',
'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec'])
# Print the Index
idx
輸出:
讓我們根據排序順序將其分解。僅在對索引中的值進行排序後才分配數值。
# Factorize the sorted labels
idx.factorize(sort = True)
輸出:
正如我們在輸出中看到的那樣,在為索引值分配數值之前,已經對其進行了排序。
相關用法
- Python pandas.map()用法及代碼示例
- Python Pandas DatetimeIndex.second用法及代碼示例
- Python Pandas.CategoricalDtype()用法及代碼示例
- Python Pandas PeriodIndex.day用法及代碼示例
- Python Pandas Series.gt()用法及代碼示例
- Python Pandas Index.contains()用法及代碼示例
- Python Pandas dataframe.add()用法及代碼示例
- Python Pandas Series.get()用法及代碼示例
- Python Pandas.to_datetime()用法及代碼示例
- Python Pandas Series.str.contains()用法及代碼示例
- Python Pandas Timestamp.tz用法及代碼示例
- Python Pandas Timestamp.dst用法及代碼示例
- Python Pandas Series.abs()用法及代碼示例
- Python Pandas Timestamp.day用法及代碼示例
- Python Pandas Series.where用法及代碼示例
注:本文由純淨天空篩選整理自Shubham__Ranjan大神的英文原創作品 Python | Pandas Index.factorize()。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。