Python是進行數據分析的一種出色語言,主要是因為以數據為中心的python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。
Pandas dataframe.filter()
函數用於根據指定索引中的標簽對 DataFrame 的行或列進行子集。請注意,此例程不會在其內容上過濾數據幀。過濾器將應用於索引標簽。
用法: DataFrame.filter(items=None, like=None, regex=None, axis=None)
參數:
items:要限製的信息軸列表(必須不全部存在)
like:將信息軸保持在“ arg in col == True”的位置
regex:保持信息軸與re.search(regex,col)== True
axis:要過濾的軸。默認情況下,這是信息軸,係列為“索引”, DataFrame 為“列”
返回:與輸入對象相同的類型
項(例如like和regex參數)被強製為互斥的。軸默認為使用[]進行索引時使用的信息軸。
有關CSV文件的鏈接,請單擊此處
範例1:采用filter()
函數過濾掉 DataFrame 的任何三列。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# Print the dataframe
df
現在,過濾“Name”,“College”和“Salary”列。
# applying filter function
df.filter(["Name", "College", "Salary"])
輸出:
範例2:采用filter()
函數可將名稱中帶有字母“ a”或“ A”的 DataFrame 中的所有列作為子集。
注意: filter()
函數也將正則表達式作為其參數之一。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# Using regular expression to extract all
# columns which has letter 'a' or 'A' in its name.
df.filter(regex ='[aA]')
輸出:
正則表達式“ [aA]”查找名稱中帶有“ a”或“ A”的所有列名稱。
相關用法
- Python pandas.map()用法及代碼示例
- Python Pandas Series.str.len()用法及代碼示例
- Python Pandas.factorize()用法及代碼示例
- Python Pandas TimedeltaIndex.name用法及代碼示例
- Python Pandas dataframe.ne()用法及代碼示例
- Python Pandas Series.between()用法及代碼示例
- Python Pandas DataFrame.where()用法及代碼示例
- Python Pandas Series.add()用法及代碼示例
- Python Pandas.pivot_table()用法及代碼示例
- Python Pandas Series.mod()用法及代碼示例
- Python Pandas Dataframe.at[ ]用法及代碼示例
- Python Pandas Dataframe.iat[ ]用法及代碼示例
- Python Pandas.pivot()用法及代碼示例
- Python Pandas dataframe.mul()用法及代碼示例
- Python Pandas.melt()用法及代碼示例
注:本文由純淨天空篩選整理自Shubham__Ranjan大神的英文原創作品 Python | Pandas dataframe.filter()。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。