Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。
Pandas set_index()
是一种将列表,系列或 DataFrame 设置为 DataFrame 索引的方法。也可以在制作 DataFrame 时设置索引列。但是有时一个数据帧是由两个或多个数据帧组成的,因此可以使用此方法更改以后的索引。
用法:
DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)
参数:
-
keys:列名或列名列表。
drop:布尔值,如果为True,则删除用于索引的列。
append:如果为True,则将该列追加到现有索引列。
inplace:如果为True,则在 DataFrame 中进行更改。
verify_integrity:如果为True,则检查新索引列是否重复。
要下载使用的CSV文件,请单击此处。
代码1:更改索引栏
在此示例中,“名字”列已成为“数据帧”的索引列。
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("employees.csv")
# setting first name as index column
data.set_index("First Name", inplace = True)
# display
data.head()
输出:
如输出图像中所示,索引列之前是一系列数字,但后来已被名字替换。
手术前-
手术后-
代码2:多索引列
在此示例中,将创建两列作为索引列。 Drop参数用于删除列,而append参数用于将传递的列追加到已经存在的索引列。
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("employees.csv")
# setting first name as index column
data.set_index(["First Name", "Gender"], inplace = True,
append = True, drop = False)
# display
data.head()
输出:
如输出Image所示,数据具有3个索引列。
相关用法
- Python pandas.map()用法及代码示例
- Python Pandas Series.str.len()用法及代码示例
- Python Pandas.factorize()用法及代码示例
- Python Pandas TimedeltaIndex.name用法及代码示例
- Python Pandas dataframe.ne()用法及代码示例
- Python Pandas Series.between()用法及代码示例
- Python Pandas DataFrame.where()用法及代码示例
- Python Pandas Series.add()用法及代码示例
- Python Pandas.pivot_table()用法及代码示例
- Python Pandas Series.mod()用法及代码示例
- Python Pandas Dataframe.at[ ]用法及代码示例
- Python Pandas Dataframe.iat[ ]用法及代码示例
- Python Pandas.pivot()用法及代码示例
- Python Pandas dataframe.mul()用法及代码示例
- Python Pandas.melt()用法及代码示例
注:本文由纯净天空筛选整理自Kartikaybhutani大神的英文原创作品 Python | Pandas DataFrame.set_index()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。