Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。
Pandas 提供了一种向系列中的每个字符串元素添加填充(空格或其他字符)的方法。每次调用.str时都必须加上前缀,以区别于Python的默认函数,否则会引发错误。
用法:Series.str.pad(width, side=’left’, fillchar=’ ‘)
参数:
width:结果字符串的最小宽度。
- 如果width小于或等于字符串的长度,则不添加填充。
- 如果width大于字符串长度,则多余的空格将用空格或传递的字符填充。
side:字符串输入(“左”,“右”或“两者”)。默认值为“左”。填充将在各侧平均添加。
fillchar:要填充的字符。默认值为‘(空白)。
返回类型:在字符串的传递侧添加空格/字符的系列
要下载代码中使用的CSV,请点击此处。
在以下示例中,使用的 DataFrame 包含一些NBA球员的数据。 str.pad()方法将用于在文本中添加填充。进行任何操作之前的数据帧图像如下所示:
范例1:左填充
在此示例中,字符串的最小长度设置为15,并使用str.pad()方法在“团队”列的字符串左侧添加了空格。由于看不到空格,因此将它们与自定义输入字符串进行比较,并仅针对团队名称“Boston Celtics”检查结果是否为True。
# importing pandas module
import pandas as pd
# making data frame from csv at url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/upload/nba.csv")
# removing null values to avoid errors
data.dropna(how ='all', inplace = True)
# adding white spaces to left side
data["Team"]= data["Team"].str.pad(15, side ='left')
# custom string
string =' Boston Celtics'
# checking if same or not
data["Team"]== string
输出:
如输出图像所示,球队名称Boston Celtics的条件为True,这意味着已成功添加空格。同样,其他字符串也会根据其长度进行填充。
范例2:右填充
在此示例中,字符串的最小长度设置为15,并使用str.pad()方法在“团队”列的字符串右侧添加了“ _”。将_传递给fillchar参数以添加它,而不是默认的空格。
# importing pandas module
import pandas as pd
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(how ='all', inplace = True)
# adding white spaces to left side
data["Team"]= data["Team"].str.pad(15, side ='right', fillchar ='_')
# output display
data
输出:
如输出图像所示,根据字符串的长度,在字符串的右侧添加了“ _”。填充后,每个字符串的长度为15。
范例3:两侧填充
在此示例中,已使用str.pad()中的fillchar参数将“ +”添加到字符串的两侧。 width参数设置为20,以便填充后每个字符串的长度变得相同。
# importing pandas module
import pandas as pd
# making data frame
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")
# removing null values to avoid errors
data.dropna(how ='all', inplace = True)
# adding white spaces to left side
data["Name"]= data["Name"].str.pad(20, side ='both', fillchar ='+')
# output
data
输出:
如输出图像所示,在字符串的两侧都添加了“ +”。每个字符串中“ +”号的数量可能不同,但是在填充后每个字符串的长度为20。
注意:从图像中可以看出,如果字符串的剩余位数为奇数(宽度-长度),则优先级将赋予右侧。因此,一个左字符将被添加到右侧。
与名称列的第一行一样,字符串的长度为13。因此20-13 =7。因此,左侧添加了3个“ +”,右侧添加了4个。
相关用法
- Python pandas.map()用法及代码示例
- Python Pandas Timestamp.tz用法及代码示例
- Python Pandas Series.str.contains()用法及代码示例
- Python Pandas dataframe.std()用法及代码示例
- Python Pandas Timestamp.dst用法及代码示例
- Python Pandas dataframe.sem()用法及代码示例
- Python Pandas DataFrame.ix[ ]用法及代码示例
- Python Pandas.Categorical()用法及代码示例
- Python Pandas.apply()用法及代码示例
- Python Pandas TimedeltaIndex.contains用法及代码示例
- Python Pandas Timestamp.now用法及代码示例
- Python Pandas Series.take()用法及代码示例
- Python Pandas dataframe.all()用法及代码示例
- Python Pandas series.str.get()用法及代码示例
- Python Pandas dataframe.add()用法及代码示例
注:本文由纯净天空筛选整理自Kartikaybhutani大神的英文原创作品 Python | Pandas Series.str.pad()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。