biopsy
位於 MASS
包(package)。 說明
該乳腺癌數據庫由 William H. Wolberg 博士從威斯康星大學麥迪遜分校醫院獲得。截至 1992 年 7 月 15 日,他對 699 名患者的乳腺腫瘤活檢進行了評估;九個屬性中的每一個都按照 1 到 10 的等級進行評分,結果也是已知的。有 699 行和 11 列。
用法
biopsy
格式
該 DataFrame 包含以下列:
ID
-
示例代碼號(不唯一)。
V1
-
團塊厚度。
V2
-
細胞大小的均勻性。
V3
-
細胞形狀的均勻性。
V4
-
邊附著力。
V5
-
單個上皮細胞的大小。
V6
-
裸核(缺少 16 個值)。
V7
-
平淡的染色質。
V8
-
正常核仁。
V9
-
有絲分裂。
class
-
"benign"
或"malignant"
。
來源
P. M. Murphy 和 D. W. Aha (1992)。 UCI 機器學習數據庫存儲庫。 [機器可讀的數據存儲庫]。加利福尼亞州歐文:加利福尼亞大學信息與計算機科學係。
O. L. Mangasarian 和 W. H. Wolberg (1990) 通過線性規劃進行癌症診斷。暹羅新聞 23,第 1 和 18 頁。
威廉·H·沃爾伯格 (William H. Wolberg) 和 O.L. Mangasarian (1990) 用於乳腺細胞學醫學診斷的多表麵模式分離方法。 《美國國家科學院院刊》,美國 87,第 9193-9196 頁。
O. L. Mangasarian、R. Setiono 和 W.H. Wolberg (1990) 通過線性規劃進行模式識別:理論及其在醫學診斷中的應用。 Large-scale 數值優化,Thomas F. Coleman 和 Yuying Li 編著,SIAM Publications,費城,第 22-30 頁。
K. P. Bennett 和 O. L. Mangasarian (1992) 兩個線性不可分集的魯棒線性規劃判別。優化方法和軟件 1,第 23-34 頁(Gordon & Breach Science Publishers)。
參考
Venables, W. N. and Ripley, B. D. (2002) Modern Applied Statistics with S-PLUS. Fourth Edition. Springer.
相關用法
- R birthwt 與嬰兒出生體重低相關的風險因子
- R boxcox 線性模型的 Box-Cox 變換
- R bandwidth.nrd 通過正態參考分布得到的密度()帶寬
- R beav1 海狸體溫係列1
- R bcv 帶寬選擇的有偏交叉驗證
- R beav2 海狸體溫係列2
- R bacteria 藥物治療後細菌的存在
- R summary.rlm 魯棒線性模型的總結方法
- R ginv 廣義逆矩陣
- R housing 哥本哈根住房條件調查的頻率表
- R predict.qda 根據二次判別分析進行分類
- R contr.sdif 連續差異對比編碼
- R Melanoma 惡性黑色素瘤的生存率
- R predict.glmmPQL glmmPQL 擬合的預測方法
- R ucv 帶寬選擇的無偏交叉驗證
- R theta.md 估計負二項式的 theta
- R parcoord 平行坐標圖
- R rlm 線性模型的穩健擬合
- R npk 經典 N、P、K 階乘實驗
- R Cars93 1993 年美國銷售的 93 輛汽車的數據
- R predict.lda 通過線性判別對多變量觀測值進行分類
- R geyser 老忠實間歇泉數據
- R summary.negbin 類“negbin”對象的摘要方法函數
- R Aids2 澳大利亞艾滋病生存數據
- R truehist 繪製直方圖
注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Biopsy Data on Breast Cancer Patients。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。