Pandas Series.str.split(~) 方法對係列中的每個字符串執行拆分。
參數
1.pat | string | optional
用於分割字符串的字符串或正則表達式模式。默認情況下,pat=" "(單個空格)。
2. n | int | optional
每個值允許的分割數。默認情況下,沒有限製。請注意,參數值 None 、 0 或 -1 將被解釋為無限製。
3. expand | boolean | optional
-
如果
True,則返回的列表將水平擴展為單獨的列。 -
如果
False,則為每個值返回一個列表。
默認情況下,expand=False 。
返回值
如果 expand=True ,則返回 DataFrame /MultiIndex。否則,返回 Series /Index。
例子
基本用法
考慮以下係列:
s = pd.Series(["a","a_1","a_2"])
s
0 a
1 a_1
2 a_2
dtype: object
要按 _ 分割每個字符串:
s.str.split("_")
0 [a]
1 [a, 1]
2 [a, 2]
dtype: object
請注意係列中的每個值現在都是一個列表。
使用正則表達式
可以直接使用正則表達式作為分隔符:
s = pd.Series(["a_1","a*2"])
s.str.split(r'[_*]')
0 [a, 1]
1 [a, 2]
dtype: object
指定n
默認情況下,可以進行的拆分數量沒有限製:
s = pd.Series(["a_1","a_2_3"])
s.str.split("_")
0 [a, 1]
1 [a, 2, 3]
dtype: object
允許每個值最多進行 1 拆分:
s.str.split("_", n=1)
0 [a, 1]
1 [a, 2_3]
dtype: object
指定展開
默認情況下, expand=False ,這意味著每個值都成為一個列表:
s = pd.Series(["a", "a_1","a_2"])
s.str.split("_")
0 [a]
1 [a, 1]
2 [a, 2]
dtype: object
您可以通過設置 expand=True 來擴展列表,如下所示:
s.str.split("_", expand=True) # returns a DataFrame
0 1
0 a None
1 a 1
2 a 2
處理缺失值
單個缺失值 ( NaN ) 的拆分結果也是 NaN :
s = pd.Series(["a_1",pd.np.NaN])
s.str.split("_")
0 [a, 1]
1 NaN
dtype: object
相關用法
- Python Pandas Series str strip方法用法及代碼示例
- Python Pandas Series str extractall方法用法及代碼示例
- Python Pandas Series str center方法用法及代碼示例
- Python Pandas Series str pad方法用法及代碼示例
- Python Pandas Series str extract方法用法及代碼示例
- Python Pandas Series str replace方法用法及代碼示例
- Python Pandas Series str len方法用法及代碼示例
- Python Pandas Series str lower方法用法及代碼示例
- Python Pandas Series str rstrip方法用法及代碼示例
- Python Pandas Series str lstrip方法用法及代碼示例
- Python Pandas Series string contains方法用法及代碼示例
- Python Pandas Series to_list方法用法及代碼示例
- Python Pandas Series between方法用法及代碼示例
- Python Pandas Series map方法用法及代碼示例
- Python Pandas Series hasnans屬性用法及代碼示例
- Python Pandas Series is_monotonic屬性用法及代碼示例
- Python Pandas Series to_frame方法用法及代碼示例
- Python Pandas Series zfill方法用法及代碼示例
- Python Pandas Series argmax方法用法及代碼示例
- Python Pandas Series is_monotonic_increasing屬性用法及代碼示例
- Python Pandas Series is_unique屬性用法及代碼示例
- Python Pandas Series argmin方法用法及代碼示例
- Python Pandas Series value_counts方法用法及代碼示例
- Python Pandas Series is_monotonic_decreasing屬性用法及代碼示例
- Python Pandas Series.cumsum()用法及代碼示例
注:本文由純淨天空篩選整理自Isshin Inada大神的英文原創作品 Pandas Series str | split method。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。
