当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python Pandas Series.str.get_dummies()用法及代码示例


Python是进行数据分析的一种出色语言,主要是因为以数据为中心的Python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。

Pandas str.get_dummies()用于在传递的分隔符处分隔调用者系列中的每个字符串。分割每个字符串后,将返回具有所有可能值的数据帧。如果原始数据帧中相同索引处的文本值包含字符串(列名/拆分值),则该位置的值为1,否则为0。

由于这是一个字符串操作,因此在每次调用此函数之前都必须为.str加上前缀。否则,将引发错误。


用法:Series.str.get_dummies(sep=’|’)

参数:
sep:字符串值,用于在以下位置分割字符串的分隔符

返回类型:仅具有二进制值的 DataFrame

要下载以下示例中使用的数据集,请单击此处。

在以下示例中,使用的 DataFrame 包含一些员工的数据。下面是任何操作之前的数据帧图像。


范例1:在空格上分隔不同的字符串。

在此示例中,“团队”列中的字符串已在“”(空格)处分割,分割后将返回具有所有可能值的数据帧。如果字符串(列名)存在于旧数据帧中相同索引的文本值中,则返回的数据帧中的值为1。

# importing pandas 
import pandas as pd 
  
# making data frame from csv at url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/employees.csv") 
  
# making dataframe using get_dummies() 
dummies = data["Team"].str.get_dummies(" ") 
  
# display 
dummies.head(10)

输出:
如输出图像所示,可以将其与数据帧的原始图像进行比较。如果字符串存在于同一索引处,则值为1,否则为0。


重要事项:

  • 如果string不为null,则至少一列在同一索引处的值为1。
  • 如果该值为null,则所有列在该索引处的值为0(可以在上面的示例的第二个元素处看到)


范例2:在多个点拆分/静态值列

在此示例中,为新列(“Hello gfg family”)取静态值。然后应用get_dummies()方法,并在“g”处分离字符串。由于“g”发生了多次,因此将有不止一列,而且所有列中的值必须相同,因为所有行的字符串也都相同。

# importing pandas 
import pandas as pd 
  
# making data frame from csv at url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/employees.csv") 
  
# string for new column 
string ="Hello gfg family"
  
# creating new column 
data["New_column"]= string 
  
# creating dummies 
df = data["New_column"].str.get_dummies("g") 
  
# display 
df.head(10)

输出:
如输出图像所示,新数据帧有3列,每行都有相同的值。



相关用法


注:本文由纯净天空筛选整理自Kartikaybhutani大神的英文原创作品 Python | Pandas Series.str.get_dummies()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。