當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python Pandas Series.str.startswith()用法及代碼示例


Python是進行數據分析的一種出色語言,主要是因為以數據為中心的Python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。

Pandas startswith()是另一種在係列或 DataFrame 中搜索和過濾文本數據的方法。此方法類似於Python的startswith()方法,但參數不同,並且僅適用於Pandas對象。因此,.str必須在每次調用此方法之前加上前綴,以便編譯器知道它與默認函數不同。

用法:Series.str.startswith(pat, na=nan)

參數:
pat:要搜索的字符串。 (不接受正則表達式)
na:用於設置序列中的值為NULL時應顯示的內容。

返回類型:布爾序列,為True,其中值的開頭是傳遞的字符串。

要下載代碼中使用的CSV,請點擊此處。

在以下示例中,使用的 DataFrame 包含一些NBA球員的數據。下麵是任何操作之前的數據幀圖像。

範例1:返回布爾係列
在此示例中,使用str.startswith()函數檢查元素在字符串的開頭是否具有“G”。返回一個布爾序列,該序列在字符串開頭具有“G”的索引位置處為真。

# importing pandas module  
import pandas as pd 
  
# reading csv file from url  
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") 
  
# String to be searched in start of string  
search ="G"
  
# boolean series returned 
data["College"].str.startswith(search)

輸出:
如輸出圖像中所示,布爾係列在索引位置處具有True,在該位置上,College列在開始時具有“G”。也可以通過查看原始數據幀的圖像進行比較。


範例2:處理NULL值
數據分析中最重要的部分是處理Null值。從上麵的輸出圖像中可以看出,布爾序列在“學院”列中的值為空或NaN的地方都具有NaN。如果將此布爾係列傳遞到數據幀中,則會產生錯誤。因此,需要使用na參數來處理NaN值。也可以將其設置為字符串,但是由於布爾序列用於傳遞和返回各自的值,因此應僅將其設置為布爾值。在此示例中,na Parameter設置為False。因此,無論“學院”列的值為Null,Bool係列將存儲False而不是NaN。之後,該係列將再次傳遞到 DataFrame 以僅顯示True值。

# importing pandas module  
import pandas as pd 
  
# reading csv file from url  
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv") 
  
# String to be searched in start of string  
search ="G"
  
# boolean series returned with False at place of NaN 
bool_series = data["College"].str.startswith(search, na = False) 
  
# displaying filtered dataframe 
data[bool_series]

輸出:
如輸出圖像中所示,數據幀具有在College列中的字符串開頭具有“G”的行。由於na參數設置為False,因此不會顯示NaN值。



相關用法


注:本文由純淨天空篩選整理自Kartikaybhutani大神的英文原創作品 Python | Pandas Series.str.startswith()。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。