Python pyspark CategoricalIndex.rename_categories用法及代码示例

本文简要介绍 pyspark.pandas.CategoricalIndex.rename_categories 的用法。

用法: CategoricalIndex.rename_categories(new_categories: Union[list, dict, Callable], inplace: bool = False) → Optional[pyspark.pandas.indexes.category.CategoricalIndex]

重命名类别。

参数：

new_categories：类似列表、类似字典或可调用

新类别将取代旧类别。

类似列表：所有项目必须是唯一的，并且新类别中的项目数量必须与现有类别数量相匹配。
dict-like：指定从旧类别到新类别的映射。映射中未包含的类别将被传递，并且映射中的额外类别将被忽略。
callable：在旧类别中的所有项目上调用的可调用对象，其返回值包含新类别。

inplace：布尔值，默认为 False

是否就地重命名类别或返回此分类的副本以及重命名的类别。

自版本 3.2.0 起已弃用。

cat：CategoricalIndex 或无: 已删除类别的分类，如果 inplace=True 则为无。

抛出：

ValueError: 如果新类别类似于列表，并且项目数量与当前类别不同，或者未验证为类别

例子：

>>> idx = ps.CategoricalIndex(["a", "a", "b"])
>>> idx.rename_categories([0, 1])
CategoricalIndex([0, 0, 1], categories=[0, 1], ordered=False, dtype='category')

对于类似字典的 new_categories ，忽略额外的键，并传递不在字典中的类别

>>> idx.rename_categories({'a': 'A', 'c': 'C'})
CategoricalIndex(['A', 'A', 'b'], categories=['A', 'b'], ordered=False, dtype='category')

您还可以提供一个可调用来创建新类别

>>> idx.rename_categories(lambda x: x.upper())
CategoricalIndex(['A', 'A', 'B'], categories=['A', 'B'], ordered=False, dtype='category')

相关用法

注：本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.CategoricalIndex.rename_categories。非经特殊声明，原始代码版权归原作者所有，本译文未经允许或授权，请勿转载或复制。

用法:

参数：

返回：

抛出：

例子：