当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark MultilabelClassificationEvaluator用法及代码示例


本文简要介绍 pyspark.ml.evaluation.MultilabelClassificationEvaluator 的用法。

用法:

class pyspark.ml.evaluation.MultilabelClassificationEvaluator(*, predictionCol='prediction', labelCol='label', metricName='f1Measure', metricLabel=0.0)

多标签分类评估器,它需要两个输入列:预测和标签。

3.0.0 版中的新函数。

注意

实验性的

例子

>>> scoreAndLabels = [([0.0, 1.0], [0.0, 2.0]), ([0.0, 2.0], [0.0, 1.0]),
...     ([], [0.0]), ([2.0], [2.0]), ([2.0, 0.0], [2.0, 0.0]),
...     ([0.0, 1.0, 2.0], [0.0, 1.0]), ([1.0], [1.0, 2.0])]
>>> dataset = spark.createDataFrame(scoreAndLabels, ["prediction", "label"])
...
>>> evaluator = MultilabelClassificationEvaluator()
>>> evaluator.setPredictionCol("prediction")
MultilabelClassificationEvaluator...
>>> evaluator.evaluate(dataset)
0.63...
>>> evaluator.evaluate(dataset, {evaluator.metricName: "accuracy"})
0.54...
>>> mlce_path = temp_path + "/mlce"
>>> evaluator.save(mlce_path)
>>> evaluator2 = MultilabelClassificationEvaluator.load(mlce_path)
>>> str(evaluator2.getPredictionCol())
'prediction'

相关用法


注:本文由纯净天空筛选整理自spark.apache.org大神的英文原创作品 pyspark.ml.evaluation.MultilabelClassificationEvaluator。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。