當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python sklearn load_breast_cancer用法及代碼示例


本文簡要介紹python語言中 sklearn.datasets.load_breast_cancer 的用法。

用法:

sklearn.datasets.load_breast_cancer(*, return_X_y=False, as_frame=False)

加載並返回乳腺癌威斯康星數據集(分類)。

乳腺癌數據集是一個經典且非常簡單的二元分類數據集。

Classes

2

每班樣本

212(男),357(乙)

樣品總數

569

Dimensionality

30

Features

真實的,積極的

在用戶指南中閱讀更多信息。

參數

return_X_y布爾,默認=假

如果為 True,則返回 (data, target) 而不是 Bunch 對象。有關datatarget 對象的更多信息,請參見下文。

as_frame布爾,默認=假

如果為 True,則數據是 pandas DataFrame,包括具有適當數據類型(數字)的列。目標是 pandas DataFrame 或 Series,具體取決於目標列的數量。如果 return_X_y 為 True,則 ( data , target ) 將是 pandas DataFrames 或 Series,如下所述。

返回

datasklearn.utils.Bunch

類似字典的對象,具有以下屬性。

數據{ndarray, dataframe} 形狀 (569, 30)

數據矩陣。如果as_frame=Truedata將是一個pandas DataFrame。

目標:{ndarray, Series} 形狀 (569,)

分類目標。如果as_frame=Truetarget將是一個pandas係列。

feature_names:列表

數據集列的名稱。

target_names:列表

目標類的名稱。

框架:DataFrame 形狀 (569, 31)

僅在 as_frame=True 時出現。 DataFrame 與 datatarget

說明:str

數據集的完整說明。

文件名:str

數據位置的路徑。

(data, target)如果return_X_y 為真,則為元組
UCI ML Breast Cancer Wisconsin (Diagnostic) 數據集的副本是
下載自:
https://goo.gl/U2Uwz2

例子

假設您對樣本 10、50 和 85 感興趣,並想知道它們的類名。

>>> from sklearn.datasets import load_breast_cancer
>>> data = load_breast_cancer()
>>> data.target[[10, 50, 85]]
array([0, 1, 0])
>>> list(data.target_names)
['malignant', 'benign']

相關用法


注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.datasets.load_breast_cancer。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。