当前位置: 首页>>代码示例>>用法及示例精选>>正文


Python - Pandas Series.str.len()用法及代码示例

Python是进行数据分析的一种出色语言,主要是因为以数据为中心的Python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。

Pandas str.len()方法用于确定Pandas系列中每个字符串的长度。此方法仅适用于一系列字符串。由于这是一个字符串方法,因此必须在每次调用.str之前添加前缀。否则会产生错误。

用法:Series.str.len()

返回类型:系列整数值。根据调用者系列的不同,也可能会出现NULL值。

要下载代码中使用的CSV,请点击此处。在以下示例中,使用的 DataFrame 包含一些NBA球员的数据。下面是任何操作之前的数据帧图像。

范例1:计算字符串系列的长度(dtype = str)

在此示例中,使用str.len()方法计算“名称”列的字符串长度。系列的dtype已经是字符串。因此,不需要数据类型转换。在执行任何操作之前,将删除空行以避免错误。

# importing pandas module  
import pandas as pd 
  
# reading csv file from url  
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") 
   
# dropping null value columns to avoid errors 
data.dropna(inplace = True) 
  
# creating new column for len 
# passing values through str.len() 
data["Name Length"]= data["Name"].str.len() 
  
# display 
data

输出:
如输出图像中所示,返回名称列中每个字符串的长度。



注意:

  • 此方法不计算整数或浮点数系列的长度。由于不是字符串系列,因此会出现错误。需要先转换系列(在下一个示例中显示)
  • 没有用于处理空值的参数。 null值也将在输出字符串中返回null。


范例2:
在此示例中,使用str.len()方法计算薪水长度列。由于该系列是作为float64 dtype导入的,因此首先使用.astype()方法将其转换为字符串。

# importing pandas module  
import pandas as pd 
  
# reading csv file from url  
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") 
   
# dropping null value columns to avoid errors 
data.dropna(inplace = True) 
  
# converting to string dtype 
data["Salary"]= data["Salary"].astype(str) 
  
# passing values 
data["Salary Length"]= data["Salary"].str.len() 
  
# converting back to float dtype 
data["Salary"]= data["Salary"].astype(float) 
  
# display 
data

输出:
如输出所示,只能通过将int或float系列的长度转换为字符串dtype来计算长度。



相关用法

注:本文由纯净天空筛选整理自Kartikaybhutani大神的英文原创作品 Python | Pandas Series.str.len()。非经特殊声明,原始代码版权归原作者所有,本译文的传播和使用请遵循“署名-相同方式共享 4.0 国际 (CC BY-SA 4.0)”协议。