Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。
Pandas dataframe.filter()
函数用于根据指定索引中的标签对 DataFrame 的行或列进行子集。请注意,此例程不会在其内容上过滤数据帧。过滤器将应用于索引标签。
用法: DataFrame.filter(items=None, like=None, regex=None, axis=None)
参数:
items:要限制的信息轴列表(必须不全部存在)
like:将信息轴保持在“ arg in col == True”的位置
regex:保持信息轴与re.search(regex,col)== True
axis:要过滤的轴。默认情况下,这是信息轴,系列为“索引”, DataFrame 为“列”
返回:与输入对象相同的类型
项(例如like和regex参数)被强制为互斥的。轴默认为使用[]进行索引时使用的信息轴。
有关CSV文件的链接,请单击此处
范例1:采用filter()
函数过滤掉 DataFrame 的任何三列。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# Print the dataframe
df
现在,过滤“Name”,“College”和“Salary”列。
# applying filter function
df.filter(["Name", "College", "Salary"])
输出:
范例2:采用filter()
函数可将名称中带有字母“ a”或“ A”的 DataFrame 中的所有列作为子集。
注意: filter()
函数也将正则表达式作为其参数之一。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.read_csv("nba.csv")
# Using regular expression to extract all
# columns which has letter 'a' or 'A' in its name.
df.filter(regex ='[aA]')
输出:
正则表达式“ [aA]”查找名称中带有“ a”或“ A”的所有列名称。
相关用法
- Python pandas.map()用法及代码示例
- Python Pandas Series.str.len()用法及代码示例
- Python Pandas.factorize()用法及代码示例
- Python Pandas TimedeltaIndex.name用法及代码示例
- Python Pandas dataframe.ne()用法及代码示例
- Python Pandas Series.between()用法及代码示例
- Python Pandas DataFrame.where()用法及代码示例
- Python Pandas Series.add()用法及代码示例
- Python Pandas.pivot_table()用法及代码示例
- Python Pandas Series.mod()用法及代码示例
- Python Pandas Dataframe.at[ ]用法及代码示例
- Python Pandas Dataframe.iat[ ]用法及代码示例
- Python Pandas.pivot()用法及代码示例
- Python Pandas dataframe.mul()用法及代码示例
- Python Pandas.melt()用法及代码示例
注:本文由纯净天空筛选整理自Shubham__Ranjan大神的英文原创作品 Python | Pandas dataframe.filter()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。