Python是進行數據分析的一種出色語言,主要是因為以數據為中心的Python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。
Pandas str.get_dummies()用於在傳遞的分隔符處分隔調用者係列中的每個字符串。分割每個字符串後,將返回具有所有可能值的數據幀。如果原始數據幀中相同索引處的文本值包含字符串(列名/拆分值),則該位置的值為1,否則為0。
由於這是一個字符串操作,因此在每次調用此函數之前都必須為.str加上前綴。否則,將引發錯誤。
用法:Series.str.get_dummies(sep=’|’)
參數:
sep:字符串值,用於在以下位置分割字符串的分隔符
返回類型:僅具有二進製值的 DataFrame
要下載以下示例中使用的數據集,請單擊此處。
在以下示例中,使用的 DataFrame 包含一些員工的數據。下麵是任何操作之前的數據幀圖像。
範例1:在空格上分隔不同的字符串。
在此示例中,“團隊”列中的字符串已在“”(空格)處分割,分割後將返回具有所有可能值的數據幀。如果字符串(列名)存在於舊數據幀中相同索引的文本值中,則返回的數據幀中的值為1。
# importing pandas
import pandas as pd
# making data frame from csv at url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/employees.csv")
# making dataframe using get_dummies()
dummies = data["Team"].str.get_dummies(" ")
# display
dummies.head(10)
輸出:
如輸出圖像所示,可以將其與數據幀的原始圖像進行比較。如果字符串存在於同一索引處,則值為1,否則為0。
重要事項:
- 如果string不為null,則至少一列在同一索引處的值為1。
- 如果該值為null,則所有列在該索引處的值為0(可以在上麵的示例的第二個元素處看到)
範例2:在多個點拆分/靜態值列
在此示例中,為新列(“Hello gfg family”)取靜態值。然後應用get_dummies()方法,並在“g”處分離字符串。由於“g”發生了多次,因此將有不止一列,而且所有列中的值必須相同,因為所有行的字符串也都相同。
# importing pandas
import pandas as pd
# making data frame from csv at url
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/employees.csv")
# string for new column
string ="Hello gfg family"
# creating new column
data["New_column"]= string
# creating dummies
df = data["New_column"].str.get_dummies("g")
# display
df.head(10)
輸出:
如輸出圖像所示,新數據幀有3列,每行都有相同的值。
相關用法
- Python pandas.map()用法及代碼示例
- Python Pandas Series.str.len()用法及代碼示例
- Python Pandas.factorize()用法及代碼示例
- Python Pandas TimedeltaIndex.name用法及代碼示例
- Python Pandas dataframe.ne()用法及代碼示例
- Python Pandas Series.between()用法及代碼示例
- Python Pandas DataFrame.where()用法及代碼示例
- Python Pandas Series.add()用法及代碼示例
- Python Pandas.pivot_table()用法及代碼示例
- Python Pandas Series.mod()用法及代碼示例
- Python Pandas Dataframe.at[ ]用法及代碼示例
- Python Pandas Dataframe.iat[ ]用法及代碼示例
- Python Pandas.pivot()用法及代碼示例
- Python Pandas dataframe.mul()用法及代碼示例
- Python Pandas.melt()用法及代碼示例
注:本文由純淨天空篩選整理自Kartikaybhutani大神的英文原創作品 Python | Pandas Series.str.get_dummies()。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。