當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python sklearn label_binarize用法及代碼示例


本文簡要介紹python語言中 sklearn.preprocessing.label_binarize 的用法。

用法:

sklearn.preprocessing.label_binarize(y, *, classes, neg_label=0, pos_label=1, sparse_output=False)

以one-vs-all 方式對標簽進行二值化。

scikit-learn 中提供了多種回歸和二元分類算法。將這些算法擴展到多類分類情況的一個簡單方法是使用所謂的one-vs-all方案。

這個函數可以為預先知道的一組固定的類標簽計算這個轉換。

參數

y類數組

要編碼的整數標簽或多標簽數據序列。

classes形狀類似數組 (n_classes,)

唯一地保存每個類的標簽。

neg_label整數,默認=0

必須對否定標簽進行編碼的值。

pos_label整數,默認=1

必須對正標簽進行編碼的值。

sparse_output布爾,默認=假,

如果需要 CSR 稀疏格式的輸出二進製數組,則設置為 true。

返回

Y{ndarray, 稀疏矩陣} 形狀 (n_samples, n_classes)

對於二元問題,形狀將為 (n_samples, 1)。稀疏矩陣將是 CSR 格式。

例子

>>> from sklearn.preprocessing import label_binarize
>>> label_binarize([1, 6], classes=[1, 2, 4, 6])
array([[1, 0, 0, 0],
       [0, 0, 0, 1]])

類排序被保留:

>>> label_binarize([1, 6], classes=[1, 6, 4, 2])
array([[1, 0, 0, 0],
       [0, 1, 0, 0]])

二進製目標轉換為列向量

>>> label_binarize(['yes', 'no', 'no', 'yes'], classes=['no', 'yes'])
array([[1],
       [0],
       [0],
       [1]])

相關用法


注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.preprocessing.label_binarize。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。