當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python cudf.core.column.string.StringMethods.split用法及代碼示例


用法:

StringMethods.split(pat: str = None, n: int = - 1, expand: bool = None) → SeriesOrIndex

圍繞給定的分隔符/分隔符拆分字符串。

在指定的分隔符字符串處從頭開始拆分係列/索引中的字符串。等效於 str.split()

參數

patstr,默認“”(空格)

要拆分的字符串,尚不支持正則表達式。

nint,默認 -1(全部)

限製輸出中的拆分數量。 None 、0 和 -1 都將被解釋為 “all splits”。

expand布爾值,默認為 False

將拆分的字符串展開為單獨的列。

  • 如果 True ,返回 DataFrame/MultiIndex 擴展維度。
  • 如果 False ,則返回包含字符串列表的係列/索引。

返回

Series、Index、DataFrame 或 MultiIndex

類型匹配調用者,除非expand=True(見注釋)。

注意

n 關鍵字的處理取決於找到的拆分數量:

  • 如果發現拆分 > n,則隻進行前 n 個拆分

  • 如果發現拆分 <= n,則進行所有拆分

  • 如果對於某一行,找到的拆分數 expand=True 。

如果使用 expand=True ,Series 和 Index 調用者分別返回 DataFrame 和 MultiIndex 對象。

例子

>>> import cudf
>>> data = ["this is a regular sentence",
...     "https://docs.python.org/index.html", None]
>>> s = cudf.Series(data)
>>> s
0            this is a regular sentence
1    https://docs.python.org/index.html
2                                  <NA>
dtype: object

在默認設置中,字符串由空格分隔。

>>> s.str.split()
0        [this, is, a, regular, sentence]
1    [https://docs.python.org/index.html]
2                                    None
dtype: list

如果沒有n 參數,rsplitsplit 的輸出是相同的。

>>> s.str.rsplit()
0        [this, is, a, regular, sentence]
1    [https://docs.python.org/index.html]
2                                    None
dtype: list

n 參數可用於限製分隔符上的拆分數量。

>>> s.str.split(n=2)
0          [this, is, a regular sentence]
1    [https://docs.python.org/index.html]
2                                    None
dtype: list

pat 參數可用於按其他字符分割。

>>> s.str.split(pat="/")
0               [this is a regular sentence]
1    [https:, , docs.python.org, index.html]
2                                       None
dtype: list

使用 expand=True 時,拆分元素將擴展為單獨的列。如果存在 <NA> 值,則它會在拆分期間傳播到整個列。

>>> s.str.split(expand=True)
                                    0     1     2        3         4
0                                this    is     a  regular  sentence
1  https://docs.python.org/index.html  <NA>  <NA>     <NA>      <NA>
2                                <NA>  <NA>  <NA>     <NA>      <NA>

相關用法


注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cudf.core.column.string.StringMethods.split。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。