當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python Pandas Series.str.get_dummies()用法及代碼示例

Python是進行數據分析的一種出色語言,主要是因為以數據為中心的Python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。

Pandas str.get_dummies()用於在傳遞的分隔符處分隔調用者係列中的每個字符串。分割每個字符串後,將返回具有所有可能值的數據幀。如果原始數據幀中相同索引處的文本值包含字符串(列名/拆分值),則該位置的值為1,否則為0。

由於這是一個字符串操作,因此在每次調用此函數之前都必須為.str加上前綴。否則,將引發錯誤。


用法:Series.str.get_dummies(sep=’|’)

參數:
sep:字符串值,用於在以下位置分割字符串的分隔符

返回類型:僅具有二進製值的 DataFrame

要下載以下示例中使用的數據集,請單擊此處。

在以下示例中,使用的 DataFrame 包含一些員工的數據。下麵是任何操作之前的數據幀圖像。


範例1:在空格上分隔不同的字符串。

在此示例中,“團隊”列中的字符串已在“”(空格)處分割,分割後將返回具有所有可能值的數據幀。如果字符串(列名)存在於舊數據幀中相同索引的文本值中,則返回的數據幀中的值為1。

# importing pandas 
import pandas as pd 
  
# making data frame from csv at url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/employees.csv") 
  
# making dataframe using get_dummies() 
dummies = data["Team"].str.get_dummies(" ") 
  
# display 
dummies.head(10)

輸出:
如輸出圖像所示,可以將其與數據幀的原始圖像進行比較。如果字符串存在於同一索引處,則值為1,否則為0。


重要事項:

  • 如果string不為null,則至少一列在同一索引處的值為1。
  • 如果該值為null,則所有列在該索引處的值為0(可以在上麵的示例的第二個元素處看到)


範例2:在多個點拆分/靜態值列

在此示例中,為新列(“Hello gfg family”)取靜態值。然後應用get_dummies()方法,並在“g”處分離字符串。由於“g”發生了多次,因此將有不止一列,而且所有列中的值必須相同,因為所有行的字符串也都相同。

# importing pandas 
import pandas as pd 
  
# making data frame from csv at url 
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/employees.csv") 
  
# string for new column 
string ="Hello gfg family"
  
# creating new column 
data["New_column"]= string 
  
# creating dummies 
df = data["New_column"].str.get_dummies("g") 
  
# display 
df.head(10)

輸出:
如輸出圖像所示,新數據幀有3列,每行都有相同的值。



相關用法


注:本文由純淨天空篩選整理自Kartikaybhutani大神的英文原創作品 Python | Pandas Series.str.get_dummies()。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。