当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark Series.cat.rename_categories用法及代码示例


本文简要介绍 pyspark.pandas.Series.cat.rename_categories 的用法。

用法:

cat.rename_categories(new_categories: Union[list, dict, Callable], inplace: bool = False) → Optional[ps.Series]

重命名类别。

参数

new_categorieslist-like、dict-like 或可调用

新类别将取代旧类别。

  • list-like:所有项目必须是唯一的,并且新类别中的项目数必须与现有类别数匹配。

  • dict-like:指定从旧类别到新类别的映射。未包含在映射中的类别将被传递,并且映射中的额外类别将被忽略。

  • callable:在旧类别中的所有项目上调用的可调用对象,其返回值包含新类别。

inplace布尔值,默认为 False

是否就地重命名类别或返回此分类的副本以及重命名的类别。

自版本 3.2.0 起已弃用。

返回

cat系列或无

已删除类别的分类,如果 inplace=True 则为无。

抛出

ValueError

如果新类别是 list-like 并且与当前类别不具有相同数量的项目或不验证为类别

例子

>>> s = ps.Series(["a", "a", "b"], dtype="category")
>>> s.cat.rename_categories([0, 1])  
0    0
1    0
2    1
dtype: category
Categories (2, int64): [0, 1]

对于 dict-like new_categories ,忽略额外的键,并传递不在字典中的类别

>>> s.cat.rename_categories({'a': 'A', 'c': 'C'})  
0    A
1    A
2    b
dtype: category
Categories (2, object): ['A', 'b']

您还可以提供一个可调用来创建新类别

>>> s.cat.rename_categories(lambda x: x.upper())  
0    A
1    A
2    B
dtype: category
Categories (2, object): ['A', 'B']

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.Series.cat.rename_categories。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。