當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyspark Series.cat.rename_categories用法及代碼示例

本文簡要介紹 pyspark.pandas.Series.cat.rename_categories 的用法。

用法:

cat.rename_categories(new_categories: Union[list, dict, Callable], inplace: bool = False) → Optional[ps.Series]

重命名類別。

參數

new_categorieslist-like、dict-like 或可調用

新類別將取代舊類別。

  • list-like:所有項目必須是唯一的,並且新類別中的項目數必須與現有類別數匹配。

  • dict-like:指定從舊類別到新類別的映射。未包含在映射中的類別將被傳遞,並且映射中的額外類別將被忽略。

  • callable:在舊類別中的所有項目上調用的可調用對象,其返回值包含新類別。

inplace布爾值,默認為 False

是否就地重命名類別或返回此分類的副本以及重命名的類別。

自版本 3.2.0 起已棄用。

返回

cat係列或無

已刪除類別的分類,如果 inplace=True 則為無。

拋出

ValueError

如果新類別是 list-like 並且與當前類別不具有相同數量的項目或不驗證為類別

例子

>>> s = ps.Series(["a", "a", "b"], dtype="category")
>>> s.cat.rename_categories([0, 1])  
0    0
1    0
2    1
dtype: category
Categories (2, int64): [0, 1]

對於 dict-like new_categories ,忽略額外的鍵,並傳遞不在字典中的類別

>>> s.cat.rename_categories({'a': 'A', 'c': 'C'})  
0    A
1    A
2    b
dtype: category
Categories (2, object): ['A', 'b']

您還可以提供一個可調用來創建新類別

>>> s.cat.rename_categories(lambda x: x.upper())  
0    A
1    A
2    B
dtype: category
Categories (2, object): ['A', 'B']

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.pandas.Series.cat.rename_categories。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。