本文整理匯總了Python中pyprepbuddy.rdds.transformable_rdd.TransformableRDD.deduplicate方法的典型用法代碼示例。如果您正苦於以下問題:Python TransformableRDD.deduplicate方法的具體用法?Python TransformableRDD.deduplicate怎麽用?Python TransformableRDD.deduplicate使用的例子?那麽, 這裏精選的方法代碼示例或許可以為您提供幫助。您也可以進一步了解該方法所在類pyprepbuddy.rdds.transformable_rdd.TransformableRDD
的用法示例。
在下文中一共展示了TransformableRDD.deduplicate方法的1個代碼示例,這些例子默認根據受歡迎程度排序。您可以為喜歡或者感覺有用的代碼點讚,您的評價將有助於係統推薦出更棒的Python代碼示例。
示例1: test_transformableRDD_can_deduplicate_by_given_column_index
# 需要導入模塊: from pyprepbuddy.rdds.transformable_rdd import TransformableRDD [as 別名]
# 或者: from pyprepbuddy.rdds.transformable_rdd.TransformableRDD import deduplicate [as 別名]
def test_transformableRDD_can_deduplicate_by_given_column_index(self):
rdd = self.sc.parallelize(["2", "3", "4", "5", "6", "7", "7", "7"])
transformable_rdd = TransformableRDD(rdd, 'csv')
deduplicate_rdd = transformable_rdd.deduplicate([0])
self.assertEquals(6, deduplicate_rdd.count())