当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cudf.core.column.string.StringMethods.extract用法及代码示例


用法:

StringMethods.extract(pat: str, flags: int = 0, expand: bool = True) → SeriesOrIndex

将正则表达式 pat 中的捕获组提取为 DataFrame 中的列。

对于系列中的每个主题字符串,从正则表达式 pat 的第一个匹配项中提取组。

参数

patstr

带有捕获组的正则表达式模式。

expand布尔值,默认为真

如果为 True,则返回每个捕获组一列的 DataFrame。如果为 False,如果有一个捕获组,则返回 Series/Index;如果有多个捕获组,则返回 DataFrame。

返回

DataFrame 或系列/索引

一个 DataFrame,每个主题字符串一行,每组一列。如果expand=Falsepat 只有一个捕获组,则返回一个系列/索引。

注意

flags 参数尚不受支持,如果传递了默认值以外的任何内容,则会引发 NotImplementedError。

例子

>>> import cudf
>>> s = cudf.Series(['a1', 'b2', 'c3'])
>>> s.str.extract(r'([ab])(\d)')
      0     1
0     a     1
1     b     2
2  <NA>  <NA>

如果 expand=True,一组模式将返回一列 DataFrame。

>>> s.str.extract(r'[ab](\d)', expand=True)
      0
0     1
1     2
2  <NA>

如果 expand=False,一组模式将返回一个系列。

>>> s.str.extract(r'[ab](\d)', expand=False)
0       1
1       2
2    <NA>
dtype: object

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.core.column.string.StringMethods.extract。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。