当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark CategoricalIndex.rename_categories用法及代码示例


本文简要介绍 pyspark.pandas.CategoricalIndex.rename_categories 的用法。

用法:

CategoricalIndex.rename_categories(new_categories: Union[list, dict, Callable], inplace: bool = False) → Optional[pyspark.pandas.indexes.category.CategoricalIndex]

重命名类别。

参数

new_categories类似列表、类似字典或可调用

新类别将取代旧类别。

  • 类似列表:所有项目必须是唯一的,并且新类别中的项目数量必须与现有类别数量相匹配。

  • dict-like:指定从旧类别到新类别的映射。映射中未包含的类别将被传递,并且映射中的额外类别将被忽略。

  • callable:在旧类别中的所有项目上调用的可调用对象,其返回值包含新类别。

inplace布尔值,默认为 False

是否就地重命名类别或返回此分类的副本以及重命名的类别。

自版本 3.2.0 起已弃用。

返回

catCategoricalIndex 或无

已删除类别的分类,如果 inplace=True 则为无。

抛出

ValueError

如果新类别类似于列表,并且项目数量与当前类别不同,或者未验证为类别

例子

>>> idx = ps.CategoricalIndex(["a", "a", "b"])
>>> idx.rename_categories([0, 1])
CategoricalIndex([0, 0, 1], categories=[0, 1], ordered=False, dtype='category')

对于类似字典的 new_categories ,忽略额外的键,并传递不在字典中的类别

>>> idx.rename_categories({'a': 'A', 'c': 'C'})
CategoricalIndex(['A', 'A', 'b'], categories=['A', 'b'], ordered=False, dtype='category')

您还可以提供一个可调用来创建新类别

>>> idx.rename_categories(lambda x: x.upper())
CategoricalIndex(['A', 'A', 'B'], categories=['A', 'B'], ordered=False, dtype='category')

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.CategoricalIndex.rename_categories。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。