Python是进行数据分析的一种出色语言,主要是因为以数据为中心的Python软件包具有奇妙的生态系统。 Pandas是其中的一种,使导入和分析数据更加容易。
Pandas str.get_dummies()用于在传递的分隔符处分隔调用者系列中的每个字符串。分割每个字符串后,将返回具有所有可能值的数据帧。如果原始数据帧中相同索引处的文本值包含字符串(列名/拆分值),则该位置的值为1,否则为0。
由于这是一个字符串操作,因此在每次调用此函数之前都必须为.str加上前缀。否则,将引发错误。
用法:Series.str.get_dummies(sep=’|’)
参数:
sep:字符串值,用于在以下位置分割字符串的分隔符
返回类型:仅具有二进制值的 DataFrame
要下载以下示例中使用的数据集,请单击此处。
在以下示例中,使用的 DataFrame 包含一些员工的数据。下面是任何操作之前的数据帧图像。
范例1:在空格上分隔不同的字符串。
在此示例中,“团队”列中的字符串已在“”(空格)处分割,分割后将返回具有所有可能值的数据帧。如果字符串(列名)存在于旧数据帧中相同索引的文本值中,则返回的数据帧中的值为1。
# importing pandas
import pandas as pd
# making data frame from csv at url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/employees.csv")
# making dataframe using get_dummies()
dummies = data["Team"].str.get_dummies(" ")
# display
dummies.head(10)
输出:
如输出图像所示,可以将其与数据帧的原始图像进行比较。如果字符串存在于同一索引处,则值为1,否则为0。
重要事项:
- 如果string不为null,则至少一列在同一索引处的值为1。
- 如果该值为null,则所有列在该索引处的值为0(可以在上面的示例的第二个元素处看到)
范例2:在多个点拆分/静态值列
在此示例中,为新列(“Hello gfg family”)取静态值。然后应用get_dummies()方法,并在“g”处分离字符串。由于“g”发生了多次,因此将有不止一列,而且所有列中的值必须相同,因为所有行的字符串也都相同。
# importing pandas
import pandas as pd
# making data frame from csv at url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/employees.csv")
# string for new column
string ="Hello gfg family"
# creating new column
data["New_column"]= string
# creating dummies
df = data["New_column"].str.get_dummies("g")
# display
df.head(10)
输出:
如输出图像所示,新数据帧有3列,每行都有相同的值。
相关用法
- Python pandas.map()用法及代码示例
- Python Pandas Series.str.len()用法及代码示例
- Python Pandas.factorize()用法及代码示例
- Python Pandas TimedeltaIndex.name用法及代码示例
- Python Pandas dataframe.ne()用法及代码示例
- Python Pandas Series.between()用法及代码示例
- Python Pandas DataFrame.where()用法及代码示例
- Python Pandas Series.add()用法及代码示例
- Python Pandas.pivot_table()用法及代码示例
- Python Pandas Series.mod()用法及代码示例
- Python Pandas Dataframe.at[ ]用法及代码示例
- Python Pandas Dataframe.iat[ ]用法及代码示例
- Python Pandas.pivot()用法及代码示例
- Python Pandas dataframe.mul()用法及代码示例
- Python Pandas.melt()用法及代码示例
注:本文由纯净天空筛选整理自Kartikaybhutani大神的英文原创作品 Python | Pandas Series.str.get_dummies()。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。