當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python pyspark RDD.saveAsPickleFile用法及代碼示例


本文簡要介紹 pyspark.RDD.saveAsPickleFile 的用法。

用法:

RDD.saveAsPickleFile(path, batchSize=10)

將此 RDD 保存為序列化對象的SequenceFile。使用的序列化器是 pyspark.serializers.PickleSerializer ,默認批量大小為 10。

例子

>>> from tempfile import NamedTemporaryFile
>>> tmpFile = NamedTemporaryFile(delete=True)
>>> tmpFile.close()
>>> sc.parallelize([1, 2, 'spark', 'rdd']).saveAsPickleFile(tmpFile.name, 3)
>>> sorted(sc.pickleFile(tmpFile.name, 5).map(str).collect())
['1', '2', 'rdd', 'spark']

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.RDD.saveAsPickleFile。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。