當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark Series.filter用法及代碼示例


本文簡要介紹 pyspark.pandas.Series.filter 的用法。

用法:

Series.filter(items: Optional[Sequence[Any]] = None, like: Optional[str] = None, regex: Optional[str] = None, axis: Union[int, str, None] = None) → pyspark.pandas.series.Series

根據指定索引中的標簽對 DataFrame 的行或列進行子集。

請注意,此例程不會根據其內容過濾 DataFrame 。過濾器應用於索引的標簽。

參數

itemslist-like

保留項目中的軸標簽。

likestring

保留“like in label == True”軸的標簽。

regex字符串(正則表達式)

保留 re.search(regex, label) == True 的軸的標簽。

axisint 或字符串軸名稱

要過濾的軸。默認情況下,這是信息軸,‘index’ 用於係列,‘columns’ 用於 DataFrame。

返回

與輸入對象相同的類型

注意

itemslikeregex 參數強製互斥。

axis 默認為使用 [] 進行索引時使用的信息軸。

例子

>>> df = ps.DataFrame(np.array(([1, 2, 3], [4, 5, 6])),
...                   index=['mouse', 'rabbit'],
...                   columns=['one', 'two', 'three'])
>>> # select columns by name
>>> df.filter(items=['one', 'three'])
        one  three
mouse     1      3
rabbit    4      6
>>> # select columns by regular expression
>>> df.filter(regex='e$', axis=1)
        one  three
mouse     1      3
rabbit    4      6
>>> # select rows containing 'bbi'
>>> df.filter(like='bbi', axis=0)
        one  two  three
rabbit    4    5      6

對於一個係列,

>>> # select rows by name
>>> df.one.filter(items=['rabbit'])
rabbit    4
Name: one, dtype: int64
>>> # select rows by regular expression
>>> df.one.filter(regex='e$')
mouse    1
Name: one, dtype: int64
>>> # select rows containing 'bbi'
>>> df.one.filter(like='bbi')
rabbit    4
Name: one, dtype: int64

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.filter。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。