Python是進行數據分析的一種出色語言,主要是因為以數據為中心的python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。
Pandas dataframe.interpolate()
函數本質上是用來填充NA
DataFrame 或係列中的值。但是,這是一個非常強大的函數,可以填補缺失的值。它使用各種插值技術來填充缺失值,而不是hard-coding值。
用法: DataFrame.interpolate(method=’linear’, axis=0, limit=None, inplace=False, limit_direction=’forward’, limit_area=None, downcast=None, **kwargs)
參數:
method:{“線性”,“時間”,“索引”,“值”,“最近”,“零”,“線性”,“二次”,“三次”,“重心”,“克羅格”,“多項式”,“樣條”,“ piecewise_polynomial”,“ from_derivatives”,“ pchip”,“ akima”}
axis:0填充column-by-column和1填充row-by-row。
limit:要填充的連續NaN的最大數量。必須大於0。
limit_direction:{“前進”,“後退”,“兩者”},默認為“前進”
limit_area:無(默認)無填充限製。inside
僅填充有效值包圍的NaN(內插)。outside
僅將NaN填充到有效值之外(外推)。如果指定了限製,則將沿該方向填充連續的NaN。
inplace:如果可能,更新NDFrame。
downcast:如果可能,請向下轉換dtypes。
kwargs:關鍵字參數傳遞給插值函數。
返回值:在NaN處插補的相同形狀的Series或DataFrame
範例1:采用interpolate()
函數使用線性方法填充缺失值。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.DataFrame({"A":[12, 4, 5, None, 1],
"B":[None, 2, 54, 3, None],
"C":[20, 16, None, 3, 8],
"D":[14, 3, None, None, 6]})
# Print the dataframe
df
讓我們使用線性方法對缺失值進行插值。請注意,線性方法會忽略索引,並將值等距地對待。
# to interpolate the missing values
df.interpolate(method ='linear', limit_direction ='forward')
輸出:
正如我們看到的輸出,第一行中的值無法填充,因為值的填充方向為forward
並且沒有可用於插值的先前值。
範例2:采用interpolate()
函數使用線性方法向後插值缺失值,並限製最大連續數Na
可以填充的值。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.DataFrame({"A":[12, 4, 5, None, 1],
"B":[None, 2, 54, 3, None],
"C":[20, 16, None, 3, 8],
"D":[14, 3, None, None, 6]})
# to interpolate the missing values
df.interpolate(method ='linear', limit_direction ='backward', limit = 1)
輸出:
請注意第四列,因為我們將極限設置為1,所以僅填充了一個缺失值。最後一行的缺失值無法填充,因為在該值之後可以插值的行不存在。
相關用法
- Python pandas.map()用法及代碼示例
- Python Pandas Series.str.len()用法及代碼示例
- Python Pandas.factorize()用法及代碼示例
- Python Pandas TimedeltaIndex.name用法及代碼示例
- Python Pandas dataframe.ne()用法及代碼示例
- Python Pandas Series.between()用法及代碼示例
- Python Pandas DataFrame.where()用法及代碼示例
- Python Pandas Series.add()用法及代碼示例
- Python Pandas.pivot_table()用法及代碼示例
- Python Pandas Series.mod()用法及代碼示例
- Python Pandas Dataframe.at[ ]用法及代碼示例
- Python Pandas Dataframe.iat[ ]用法及代碼示例
- Python Pandas.pivot()用法及代碼示例
- Python Pandas dataframe.mul()用法及代碼示例
- Python Pandas.melt()用法及代碼示例
注:本文由純淨天空篩選整理自Shubham__Ranjan大神的英文原創作品 Python | Pandas dataframe.interpolate()。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。