當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python Pandas Series.str.slice()用法及代碼示例

Python是進行數據分析的一種出色語言,主要是因為以數據為中心的python軟件包具有奇妙的生態係統。 Pandas是其中的一種,使導入和分析數據更加容易。

Pandas str.slice()方法用於從Pandas係列對象中存在的字符串中分割子字符串。它非常類似於Python在[start:stop:step]上進行切片的基本原理,這意味著它需要三個參數,即開始位置,結束位置和要跳過的元素數量。由於這是一個 Pandas 字符串方法,因此在每次調用此方法之前都必須給.str加上前綴。否則,將產生錯誤。

用法:Series.str.slice(start=None, stop=None, step=None)

參數:
start:int值,告訴從哪裏開始切片
stop:int值,告訴在哪裏結束切片
step:int值,指示切片期間要步進多少個字符

返回類型:切片子串係列

要下載代碼中使用的CSV,請點擊此處。

在以下示例中,使用的 DataFrame 包含一些NBA球員的數據。下麵是任何操作之前的數據幀圖像。


範例1:
在此示例中,salary列已被切片以獲取小數點前的值。例如,我們想做一些數學運算,為此我們需要整數數據,因此,salary列將被切片直到倒數第二個元素(-2位置)。
由於薪水列是作為float64數據類型導入的,因此首先使用.astype()方法將其轉換為字符串。

# importing pandas module  
import pandas as pd  
    
# making data frame  
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")  
    
# removing null values to avoid errors  
data.dropna(inplace = True)  
  
# start stop and step variables 
start, stop, step = 0, -2, 1
  
# converting to string data type 
data["Salary"]= data["Salary"].astype(str) 
  
# slicing till 2nd last element 
data["Salary (int)"]= data["Salary"].str.slice(start, stop, step) 
  
# display 
data.head(10)

輸出:
如輸出圖像中所示,字符串已被切片,十進製之前的字符串存儲在新列中。


注意:此方法沒有任何參數可以處理空值,因此已使用.dropna()方法將其刪除。

範例2:
在此示例中,將對name列進行切片,並保留step參數2。因此,在切片過程中它將步進兩個字符。

# importing pandas module  
import pandas as pd  
    
# making data frame  
data = pd.read_csv("https://media.geeksforgeeks.org/wp-content/uploads/nba.csv")  
    
# removing null values to avoid errors  
data.dropna(inplace = True)  
  
# start stop and step variables 
start, stop, step = 0, -2, 2
  
# slicing till 2nd last element 
data["Name"]= data["Name"].str.slice(start, stop, step) 
  
# display 
data.head(10)

輸出:
從輸出圖像中可以看出,切片時對Name進行了切片,並跳過了2個字符。



相關用法


注:本文由純淨天空篩選整理自Kartikaybhutani大神的英文原創作品 Python | Pandas Series.str.slice()。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。