当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cudf.core.column.string.StringMethods.rsplit用法及代码示例


用法:

StringMethods.rsplit(pat: str = None, n: int = - 1, expand: bool = None) → SeriesOrIndex

围绕给定的分隔符/分隔符拆分字符串。

在指定的分隔符字符串处从末尾拆分系列/索引中的字符串。等效于 str.rsplit()

参数

patstr,默认“”(空格)

要拆分的字符串,尚不支持正则表达式。

nint,默认 -1(全部)

限制输出中的拆分数量。 None 、0 和 -1 都将被解释为 “all splits”。

expand布尔值,默认为 False

将拆分的字符串展开为单独的列。

  • 如果 True ,返回 DataFrame/MultiIndex 扩展维度。
  • 如果 False ,则返回包含字符串列表的系列/索引。

返回

Series、Index、DataFrame 或 MultiIndex

类型匹配调用者,除非expand=True(见注释)。

注意

n 关键字的处理取决于找到的拆分数量:

  • 如果发现拆分 > n,则只进行前 n 个拆分
  • 如果发现拆分 <= n,则进行所有拆分
  • 如果对于某一行,找到的拆分数 expand=True 。

如果使用 expand=True ,Series 和 Index 调用者分别返回 DataFrame 和 MultiIndex 对象。

例子

>>> import cudf
>>> s = cudf.Series(
...     [
...         "this is a regular sentence",
...         "https://docs.python.org/3/tutorial/index.html",
...         None
...     ]
... )
>>> s
0                       this is a regular sentence
1    https://docs.python.org/3/tutorial/index.html
2                                             <NA>
dtype: object

在默认设置中,字符串由空格分隔。

>>> s.str.rsplit()
0                   [this, is, a, regular, sentence]
1    [https://docs.python.org/3/tutorial/index.html]
2                                               None
dtype: list

如果没有n 参数,rsplitsplit 的输出是相同的。

>>> s.str.split()
0                   [this, is, a, regular, sentence]
1    [https://docs.python.org/3/tutorial/index.html]
2                                               None
dtype: list

n 参数可用于限制分隔符上的拆分次数。 split 和 rsplit 的输出是不同的。

>>> s.str.rsplit(n=2)
0                     [this is a, regular, sentence]
1    [https://docs.python.org/3/tutorial/index.html]
2                                               None
dtype: list
>>> s.str.split(n=2)
0                     [this, is, a regular sentence]
1    [https://docs.python.org/3/tutorial/index.html]
2                                               None
dtype: list

使用 expand=True 时,拆分元素将扩展为单独的列。如果存在 <NA> 值,则它会在拆分期间传播到整个列。

>>> s.str.rsplit(n=2, expand=True)
                                               0        1         2
0                                      this is a  regular  sentence
1  https://docs.python.org/3/tutorial/index.html     <NA>      <NA>
2                                           <NA>     <NA>      <NA>

对于稍微复杂的用例,例如从 url 中拆分 html 文档名称,可以使用参数设置的组合。

>>> s.str.rsplit("/", n=1, expand=True)
                                    0           1
0          this is a regular sentence        <NA>
1  https://docs.python.org/3/tutorial  index.html
2                                <NA>        <NA>

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cudf.core.column.string.StringMethods.rsplit。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。