當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python cudf.core.column.string.StringMethods.extract用法及代碼示例


用法:

StringMethods.extract(pat: str, flags: int = 0, expand: bool = True) → SeriesOrIndex

將正則表達式 pat 中的捕獲組提取為 DataFrame 中的列。

對於係列中的每個主題字符串,從正則表達式 pat 的第一個匹配項中提取組。

參數

patstr

帶有捕獲組的正則表達式模式。

expand布爾值,默認為真

如果為 True,則返回每個捕獲組一列的 DataFrame。如果為 False,如果有一個捕獲組,則返回 Series/Index;如果有多個捕獲組,則返回 DataFrame。

返回

DataFrame 或係列/索引

一個 DataFrame,每個主題字符串一行,每組一列。如果expand=Falsepat 隻有一個捕獲組,則返回一個係列/索引。

注意

flags 參數尚不受支持,如果傳遞了默認值以外的任何內容,則會引發 NotImplementedError。

例子

>>> import cudf
>>> s = cudf.Series(['a1', 'b2', 'c3'])
>>> s.str.extract(r'([ab])(\d)')
      0     1
0     a     1
1     b     2
2  <NA>  <NA>

如果 expand=True,一組模式將返回一列 DataFrame。

>>> s.str.extract(r'[ab](\d)', expand=True)
      0
0     1
1     2
2  <NA>

如果 expand=False,一組模式將返回一個係列。

>>> s.str.extract(r'[ab](\d)', expand=False)
0       1
1       2
2    <NA>
dtype: object

相關用法


注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cudf.core.column.string.StringMethods.extract。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。