當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyspark CategoricalIndex.remove_unused_categories用法及代碼示例

本文簡要介紹 pyspark.pandas.CategoricalIndex.remove_unused_categories 的用法。

用法:

CategoricalIndex.remove_unused_categories(inplace: bool = False) → Optional[pyspark.pandas.indexes.category.CategoricalIndex]

刪除不使用的類別。

參數

inplace布爾值,默認為 False

是否刪除未使用的類別或返回此分類的副本,其中未使用的類別已刪除。

自版本 3.2.0 起已棄用。

返回

catCategoricalIndex 或無

如果 inplace=True ,則刪除未使用的類別或 None 。

例子

>>> idx = ps.CategoricalIndex(list("abbccc"), categories=['a', 'b', 'c', 'd'])
>>> idx  
CategoricalIndex(['a', 'b', 'b', 'c', 'c', 'c'],
                 categories=['a', 'b', 'c', 'd'], ordered=False, dtype='category')
>>> idx.remove_unused_categories()  
CategoricalIndex(['a', 'b', 'b', 'c', 'c', 'c'],
                 categories=['a', 'b', 'c'], ordered=False, dtype='category')

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.CategoricalIndex.remove_unused_categories。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。