當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python Pandas dataframe.reindex()用法及代碼示例

Python是進行數據分析的一種出色語言,主要是因為以數據為中心的python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。

Pandas dataframe.reindex()函數使用可選的填充邏輯使DataFrame符合新索引,將NA /NaN放置在先前索引中沒有值的位置。除非新索引等於當前索引並且copy = False,否則將生成一個新對象。

用法: DataFrame.reindex(labels=None, index=None, columns=None, axis=None, method=None, copy=True, level=None, fill_value=nan, limit=None, tolerance=None)

參數:
labels:新標簽/索引使“ axis”指定的軸與之一致。
index, columns:要符合的新標簽/索引。最好是一個Index對象,以避免重複數據
axis:軸到目標。可以是軸名稱(“索引”,“列”)或數字(0、1)。
method:{None,“ backfill” /“ bfill”,“ pad” /“ ffill”,“ nearest”},可選
copy:即使傳遞的索引相同,也返回一個新對象
level:在一個級別上廣播,在傳遞的MultiIndex級別上匹配索引值
fill_value:在計算之前,請使用此值填充現有的缺失(NaN)值以及成功完成DataFrame對齊所需的任何新元素。如果兩個對應的DataFrame位置中的數據均丟失,則結果將丟失。
limit:向前或向後填充的最大連續元素數
tolerance:不完全匹配的原始標簽和新標簽之間的最大距離。匹配位置處的索引值最滿足方程abs(index [indexer]-target)

返回:重新索引:DataFrame

範例1:采用reindex()用於重新索引 DataFrame 的函數。默認情況下,新索引中在 DataFrame 中沒有對應記錄的值被分配為NaN。
注意:我們可以通過將值傳遞給關鍵字fill_value來填充缺失的值。

# importing pandas as pd 
import pandas as pd 
  
# Creating the dataframe  
df = pd.DataFrame({"A":[1, 5, 3, 4, 2], 
                   "B":[3, 2, 4, 3, 4], 
                   "C":[2, 2, 7, 3, 4], 
                   "D":[4, 3, 6, 12, 7]}, 
                   index =["first", "second", "third", "fourth", "fifth"]) 
  
# Print the dataframe 
df

讓我們使用dataframe.reindex()重新索引 DataFrame 的函數

# reindexing with new index values 
df.reindex(["first", "dues", "trois", "fourth", "fifth"])

輸出:

注意輸出,新索引填充為NaN值,我們可以使用參數fill_value填寫缺少的值

# filling the missing values by 100 
df.reindex(["first", "dues", "trois", "fourth", "fifth"], fill_value = 100)

輸出:


範例2:采用reindex()重新索引列軸的函數

# importing pandas as pd 
import pandas as pd 
  
# Creating the first dataframe  
df1 = pd.DataFrame({"A":[1, 5, 3, 4, 2], 
                    "B":[3, 2, 4, 3, 4], 
                    "C":[2, 2, 7, 3, 4], 
                    "D":[4, 3, 6, 12, 7]}) 
  
# reindexing the column axis with 
# old and new index values 
df.reindex(columns =["A", "B", "D", "E"])

輸出:

注意,我們有NaN重新編製索引後,新列中的值會發生變化,我們可以解決重新編製索引時遺漏的值。通過論證fill_value 函數。

# reindex the columns 
# fill the missing values by 25 
df.reindex(columns =["A", "B", "D", "E"], fill_value = 25)

輸出:



相關用法


注:本文由純淨天空篩選整理自Shubham__Ranjan大神的英文原創作品 Python | Pandas dataframe.reindex()。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。