当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark DataFrame.applymap用法及代码示例


本文简要介绍 pyspark.pandas.DataFrame.applymap 的用法。

用法:

DataFrame.applymap(func: Callable[[Any], Any]) → pyspark.pandas.frame.DataFrame

将函数应用于 Dataframe 元素。

此方法应用一个函数,该函数接受并向 DataFrame 的每个元素返回一个标量。

注意

此 API 执行该函数一次以推断可能昂贵的类型,例如,在聚合或排序后创建数据集时。

为避免这种情况,请在 func 中指定返回类型,例如,如下所示:

>>> def square(x) -> np.int32:
...     return x ** 2

pandas-on-Spark 使用返回类型提示并且不尝试推断类型。

参数

func可调用的

Python 函数,从单个值返回单个值。

返回

DataFrame

转换后的 DataFrame 。

例子

>>> df = ps.DataFrame([[1, 2.12], [3.356, 4.567]])
>>> df
       0      1
0  1.000  2.120
1  3.356  4.567
>>> def str_len(x) -> int:
...     return len(str(x))
>>> df.applymap(str_len)
   0  1
0  3  4
1  5  5
>>> def power(x) -> float:
...     return x ** 2
>>> df.applymap(power)
           0          1
0   1.000000   4.494400
1  11.262736  20.857489

您可以省略类型提示并让pandas-on-Spark 推断其类型。

>>> df.applymap(lambda x: x ** 2)
           0          1
0   1.000000   4.494400
1  11.262736  20.857489

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.applymap。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。