当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python sklearn load_breast_cancer用法及代码示例


本文简要介绍python语言中 sklearn.datasets.load_breast_cancer 的用法。

用法:

sklearn.datasets.load_breast_cancer(*, return_X_y=False, as_frame=False)

加载并返回乳腺癌威斯康星数据集(分类)。

乳腺癌数据集是一个经典且非常简单的二元分类数据集。

Classes

2

每班样本

212(男),357(乙)

样品总数

569

Dimensionality

30

Features

真实的,积极的

在用户指南中阅读更多信息。

参数

return_X_y布尔,默认=假

如果为 True,则返回 (data, target) 而不是 Bunch 对象。有关datatarget 对象的更多信息,请参见下文。

as_frame布尔,默认=假

如果为 True,则数据是 pandas DataFrame,包括具有适当数据类型(数字)的列。目标是 pandas DataFrame 或 Series,具体取决于目标列的数量。如果 return_X_y 为 True,则 ( data , target ) 将是 pandas DataFrames 或 Series,如下所述。

返回

datasklearn.utils.Bunch

类似字典的对象,具有以下属性。

数据{ndarray, dataframe} 形状 (569, 30)

数据矩阵。如果as_frame=Truedata将是一个pandas DataFrame。

目标:{ndarray, Series} 形状 (569,)

分类目标。如果as_frame=Truetarget将是一个pandas系列。

feature_names:列表

数据集列的名称。

target_names:列表

目标类的名称。

框架:DataFrame 形状 (569, 31)

仅在 as_frame=True 时出现。 DataFrame 与 datatarget

说明:str

数据集的完整说明。

文件名:str

数据位置的路径。

(data, target)如果return_X_y 为真,则为元组
UCI ML Breast Cancer Wisconsin (Diagnostic) 数据集的副本是
下载自:
https://goo.gl/U2Uwz2

例子

假设您对样本 10、50 和 85 感兴趣,并想知道它们的类名。

>>> from sklearn.datasets import load_breast_cancer
>>> data = load_breast_cancer()
>>> data.target[[10, 50, 85]]
array([0, 1, 0])
>>> list(data.target_names)
['malignant', 'benign']

相关用法


注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.datasets.load_breast_cancer。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。