当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark AccumulatorParam用法及代码示例


本文简要介绍 pyspark.AccumulatorParam 的用法。

用法:

class pyspark.AccumulatorParam

定义如何累积给定类型的值的帮助对象。

例子

>>> from pyspark.accumulators import AccumulatorParam
>>> class VectorAccumulatorParam(AccumulatorParam):
...     def zero(self, value):
...         return [0.0] * len(value)
...     def addInPlace(self, val1, val2):
...         for i in range(len(val1)):
...              val1[i] += val2[i]
...         return val1
>>> va = sc.accumulator([1.0, 2.0, 3.0], VectorAccumulatorParam())
>>> va.value
[1.0, 2.0, 3.0]
>>> def g(x):
...     global va
...     va += [x] * 3
>>> rdd = sc.parallelize([1,2,3])
>>> rdd.foreach(g)
>>> va.value
[7.0, 8.0, 9.0]

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.AccumulatorParam。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。