Python pyspark CategoricalIndex.rename_categories用法及代碼示例

本文簡要介紹 pyspark.pandas.CategoricalIndex.rename_categories 的用法。

用法: CategoricalIndex.rename_categories(new_categories: Union[list, dict, Callable], inplace: bool = False) → Optional[pyspark.pandas.indexes.category.CategoricalIndex]

重命名類別。

參數：

new_categories：類似列表、類似字典或可調用

新類別將取代舊類別。

類似列表：所有項目必須是唯一的，並且新類別中的項目數量必須與現有類別數量相匹配。
dict-like：指定從舊類別到新類別的映射。映射中未包含的類別將被傳遞，並且映射中的額外類別將被忽略。
callable：在舊類別中的所有項目上調用的可調用對象，其返回值包含新類別。

inplace：布爾值，默認為 False

是否就地重命名類別或返回此分類的副本以及重命名的類別。

自版本 3.2.0 起已棄用。

cat：CategoricalIndex 或無: 已刪除類別的分類，如果 inplace=True 則為無。

拋出：

ValueError: 如果新類別類似於列表，並且項目數量與當前類別不同，或者未驗證為類別

例子：

>>> idx = ps.CategoricalIndex(["a", "a", "b"])
>>> idx.rename_categories([0, 1])
CategoricalIndex([0, 0, 1], categories=[0, 1], ordered=False, dtype='category')

對於類似字典的 new_categories ，忽略額外的鍵，並傳遞不在字典中的類別

>>> idx.rename_categories({'a': 'A', 'c': 'C'})
CategoricalIndex(['A', 'A', 'b'], categories=['A', 'b'], ordered=False, dtype='category')

您還可以提供一個可調用來創建新類別

>>> idx.rename_categories(lambda x: x.upper())
CategoricalIndex(['A', 'A', 'B'], categories=['A', 'B'], ordered=False, dtype='category')

相關用法

注：本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.CategoricalIndex.rename_categories。非經特殊聲明，原始代碼版權歸原作者所有，本譯文未經允許或授權，請勿轉載或複製。

用法:

參數：

返回：

拋出：

例子：