當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyspark CategoricalIndex.rename_categories用法及代碼示例

本文簡要介紹 pyspark.pandas.CategoricalIndex.rename_categories 的用法。

用法:

CategoricalIndex.rename_categories(new_categories: Union[list, dict, Callable], inplace: bool = False) → Optional[pyspark.pandas.indexes.category.CategoricalIndex]

重命名類別。

參數

new_categories類似列表、類似字典或可調用

新類別將取代舊類別。

  • 類似列表:所有項目必須是唯一的,並且新類別中的項目數量必須與現有類別數量相匹配。

  • dict-like:指定從舊類別到新類別的映射。映射中未包含的類別將被傳遞,並且映射中的額外類別將被忽略。

  • callable:在舊類別中的所有項目上調用的可調用對象,其返回值包含新類別。

inplace布爾值,默認為 False

是否就地重命名類別或返回此分類的副本以及重命名的類別。

自版本 3.2.0 起已棄用。

返回

catCategoricalIndex 或無

已刪除類別的分類,如果 inplace=True 則為無。

拋出

ValueError

如果新類別類似於列表,並且項目數量與當前類別不同,或者未驗證為類別

例子

>>> idx = ps.CategoricalIndex(["a", "a", "b"])
>>> idx.rename_categories([0, 1])
CategoricalIndex([0, 0, 1], categories=[0, 1], ordered=False, dtype='category')

對於類似字典的 new_categories ,忽略額外的鍵,並傳遞不在字典中的類別

>>> idx.rename_categories({'a': 'A', 'c': 'C'})
CategoricalIndex(['A', 'A', 'b'], categories=['A', 'b'], ordered=False, dtype='category')

您還可以提供一個可調用來創建新類別

>>> idx.rename_categories(lambda x: x.upper())
CategoricalIndex(['A', 'A', 'B'], categories=['A', 'B'], ordered=False, dtype='category')

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.CategoricalIndex.rename_categories。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。