當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python pyspark MultilabelClassificationEvaluator用法及代碼示例

本文簡要介紹 pyspark.ml.evaluation.MultilabelClassificationEvaluator 的用法。

用法:

class pyspark.ml.evaluation.MultilabelClassificationEvaluator(*, predictionCol='prediction', labelCol='label', metricName='f1Measure', metricLabel=0.0)

多標簽分類評估器,它需要兩個輸入列:預測和標簽。

3.0.0 版中的新函數。

注意

實驗性的

例子

>>> scoreAndLabels = [([0.0, 1.0], [0.0, 2.0]), ([0.0, 2.0], [0.0, 1.0]),
...     ([], [0.0]), ([2.0], [2.0]), ([2.0, 0.0], [2.0, 0.0]),
...     ([0.0, 1.0, 2.0], [0.0, 1.0]), ([1.0], [1.0, 2.0])]
>>> dataset = spark.createDataFrame(scoreAndLabels, ["prediction", "label"])
...
>>> evaluator = MultilabelClassificationEvaluator()
>>> evaluator.setPredictionCol("prediction")
MultilabelClassificationEvaluator...
>>> evaluator.evaluate(dataset)
0.63...
>>> evaluator.evaluate(dataset, {evaluator.metricName: "accuracy"})
0.54...
>>> mlce_path = temp_path + "/mlce"
>>> evaluator.save(mlce_path)
>>> evaluator2 = MultilabelClassificationEvaluator.load(mlce_path)
>>> str(evaluator2.getPredictionCol())
'prediction'

相關用法


注:本文由純淨天空篩選整理自spark.apache.org大神的英文原創作品 pyspark.ml.evaluation.MultilabelClassificationEvaluator。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。