当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark RDD.keyBy用法及代码示例


本文简要介绍 pyspark.RDD.keyBy 的用法。

用法:

RDD.keyBy(f)

通过应用 f 创建此 RDD 中元素的元组。

例子

>>> x = sc.parallelize(range(0,3)).keyBy(lambda x: x*x)
>>> y = sc.parallelize(zip(range(0,5), range(0,5)))
>>> [(x, list(map(list, y))) for x, y in sorted(x.cogroup(y).collect())]
[(0, [[0], [0]]), (1, [[1], [1]]), (2, [[], [2]]), (3, [[], [3]]), (4, [[2], [4]])]

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.RDD.keyBy。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。