當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyspark Series.cat.remove_unused_categories用法及代碼示例

本文簡要介紹 pyspark.pandas.Series.cat.remove_unused_categories 的用法。

用法:

cat.remove_unused_categories(inplace: bool = False) → Optional[ps.Series]

刪除不使用的類別。

參數

inplace布爾值,默認為 False

是否刪除未使用的類別或返回此分類的副本,其中未使用的類別已刪除。

自版本 3.2.0 起已棄用。

返回

cat係列或無

如果 inplace=True ,則刪除未使用的類別或 None 。

例子

>>> s = ps.Series(pd.Categorical(list("abbccc"), categories=['a', 'b', 'c', 'd']))
>>> s  
0    a
1    b
2    b
3    c
4    c
5    c
dtype: category
Categories (4, object): ['a', 'b', 'c', 'd']
>>> s.cat.remove_unused_categories()  
0    a
1    b
2    b
3    c
4    c
5    c
dtype: category
Categories (3, object): ['a', 'b', 'c']

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.cat.remove_unused_categories。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。