本文简要介绍
pyspark.pandas.DataFrame.applymap
的用法。用法:
DataFrame.applymap(func: Callable[[Any], Any]) → pyspark.pandas.frame.DataFrame
将函数应用于 Dataframe 元素。
此方法应用一个函数,该函数接受并向 DataFrame 的每个元素返回一个标量。
注意
此 API 执行该函数一次以推断可能昂贵的类型,例如,在聚合或排序后创建数据集时。
为避免这种情况,请在
func
中指定返回类型,例如,如下所示:>>> def square(x) -> np.int32: ... return x ** 2
pandas-on-Spark 使用返回类型提示并且不尝试推断类型。
- func:可调用的
Python 函数,从单个值返回单个值。
- DataFrame
转换后的 DataFrame 。
参数:
返回:
例子:
>>> df = ps.DataFrame([[1, 2.12], [3.356, 4.567]]) >>> df 0 1 0 1.000 2.120 1 3.356 4.567
>>> def str_len(x) -> int: ... return len(str(x)) >>> df.applymap(str_len) 0 1 0 3 4 1 5 5
>>> def power(x) -> float: ... return x ** 2 >>> df.applymap(power) 0 1 0 1.000000 4.494400 1 11.262736 20.857489
您可以省略类型提示并让pandas-on-Spark 推断其类型。
>>> df.applymap(lambda x: x ** 2) 0 1 0 1.000000 4.494400 1 11.262736 20.857489
相关用法
- Python pyspark DataFrame.apply用法及代码示例
- Python pyspark DataFrame.append用法及代码示例
- Python pyspark DataFrame.align用法及代码示例
- Python pyspark DataFrame.any用法及代码示例
- Python pyspark DataFrame.alias用法及代码示例
- Python pyspark DataFrame.at用法及代码示例
- Python pyspark DataFrame.add_prefix用法及代码示例
- Python pyspark DataFrame.all用法及代码示例
- Python pyspark DataFrame.add用法及代码示例
- Python pyspark DataFrame.axes用法及代码示例
- Python pyspark DataFrame.astype用法及代码示例
- Python pyspark DataFrame.aggregate用法及代码示例
- Python pyspark DataFrame.abs用法及代码示例
- Python pyspark DataFrame.agg用法及代码示例
- Python pyspark DataFrame.assign用法及代码示例
- Python pyspark DataFrame.at_time用法及代码示例
- Python pyspark DataFrame.add_suffix用法及代码示例
- Python pyspark DataFrame.to_latex用法及代码示例
- Python pyspark DataFrame.plot.bar用法及代码示例
- Python pyspark DataFrame.to_delta用法及代码示例
- Python pyspark DataFrame.quantile用法及代码示例
- Python pyspark DataFrame.cumsum用法及代码示例
- Python pyspark DataFrame.iloc用法及代码示例
- Python pyspark DataFrame.dropDuplicates用法及代码示例
- Python pyspark DataFrame.printSchema用法及代码示例
注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.DataFrame.applymap。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。