當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python Pandas Series.str.extract()用法及代碼示例


Series.str可用於以字符串形式訪問係列的值並對其應用幾種方法。 Pandas Series.str.extract()函數用於提取正則表達式中的捕獲組作為DataFrame中的列。對於係列中的每個主題字符串,從正則表達式pat的第一個匹配項中提取組。

用法: Series.str.extract(pat, flags=0, expand=True)

參數:
pat:具有捕獲組的正則表達式模式。
flags:int,默認值為0(無標誌)
expand:如果為True,則返回每個捕獲組隻有一列的DataFrame。


返回:DataFrame或係列或索引

範例1:采用Series.str.extract()函數從給定係列對象的基礎數據中的字符串中提取組。

# importing pandas as pd 
import pandas as pd 
  
# importing re for regular expressions 
import re 
  
# Creating the Series 
sr = pd.Series(['New_York', 'Lisbon', 'Tokyo', 'Paris', 'Munich']) 
  
# Creating the index 
idx = ['City 1', 'City 2', 'City 3', 'City 4', 'City 5'] 
  
# set the index 
sr.index = idx 
  
# Print the series 
print(sr)

輸出:

現在我們將使用Series.str.extract()函數從給定係列對象中的字符串中提取組。

# extract groups having a vowel followed by 
# any character 
result = sr.str.extract(pat = '([aeiou].)') 
  
# print the result 
print(result)

輸出:

正如我們在輸出中看到的,Series.str.extract()函數已返回一個 DataFrame ,其中包含提取的組的一列。

範例2:采用Series.str.extract()函數從給定係列對象的基礎數據中的字符串中提取組。

# importing pandas as pd 
import pandas as pd 
  
# importing re for regular expressions 
import re 
  
# Creating the Series 
sr = pd.Series(['Mike', 'Alessa', 'Nick', 'Kim', 'Britney']) 
  
# Creating the index 
idx = ['Name 1', 'Name 2', 'Name 3', 'Name 4', 'Name 5'] 
  
# set the index 
sr.index = idx 
  
# Print the series 
print(sr)

輸出:


現在我們將使用Series.str.extract()函數從給定係列對象中的字符串中提取組。

# extract groups having any capital letter 
# followed by 'i' and any other character 
result = sr.str.extract(pat = '([A-Z]i.)') 
  
# print the result 
print(result)

輸出:

正如我們在輸出中看到的,Series.str.extract()函數已返回一個 DataFrame ,其中包含提取的組的一列。



相關用法


注:本文由純淨天空篩選整理自Shubham__Ranjan大神的英文原創作品 Python | Pandas Series.str.extract()。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。