mona
位於 cluster
包(package)。 說明
返回一個列表,表示僅包含二進製變量的數據集的分裂層次聚類。
用法
mona(x, trace.lev = 0)
參數
x |
數據矩陣或 DataFrame ,其中每行對應一個觀察值,每列對應一個變量。所有變量必須是二進製的。允許有限數量的缺失值 ( |
trace.lev |
邏輯或整數,指示算法是否(以及多少)應產生進度輸出。 |
細節
mona
在 Kaufman 和 Rousseuw (1990) 的第 7 章中有完整說明。它是“monothetic”,因為每個劃分都基於單個(well-chosen)變量,而大多數其他分層方法(包括agnes
和diana
)是“polythetic”,即它們一起使用所有變量。
mona
-算法從一個大集群開始構建集群層次結構。聚類被劃分,直到同一聚類中的所有觀測值的所有變量都具有相同的值。
在每一階段,所有簇都根據一個變量的值進行劃分。聚類分為一個聚類,其中該變量的所有觀測值均為 1,另一個聚類的所有觀測值對該變量的值為 0。
根據要分割的聚類中的觀察結果,用於分割聚類的變量是與其他變量具有最大總關聯性的變量。變量 f 和 g 之間的關聯由 a(f,g)*d(f,g) - b(f,g)*c(f,g) 給出,其中 a(f,g), b(f, g)、c(f,g) 和 d(f,g) 是 f 和 g 列聯表中的數字。 [也就是說,a(f,g)(分別為 d(f,g))是 f 和 g 均值為 0(分別為 1)的觀測值的數量; b(f,g)(分別為 c(f,g))是 f 值為 0(分別為 1)且 g 值為 1(分別為 0)的觀測值的數量。] 變量的總關聯f 是其與所有變量的關聯之和。
值
代表聚類的 "mona"
類的對象。有關詳細信息,請參閱mona.object
。
缺失值(NA
s)
mona-algorithm 需要 “pure” 0-1 值。但是,mona(x)
允許x
包含(不是太多)NA
。在初步步驟中,這些是“imputed”,即填充所有缺失值。為此,使用與算法中相同的變量之間關聯度量。當變量f有缺失值時,查找與f具有最大絕對關聯的變量g。當 f 和 g 之間的關聯為正時,f 的任何缺失值都將替換為同一觀測值的 g 值。如果 f 和 g 之間的關聯為負,則 f 的任何缺失值都將替換為同一觀測值的 1-g 值。
注意
在 cluster
2.0.6 之前的版本中,算法在一個變量(即 ncol(x) == 1
)的邊界情況下進入無限循環,當前發出錯誤信號(因為現在的 C 算法沒有正確考慮到這一點)特例)。
例子
data(animals)
ma <- mona(animals)
ma
## Plot similar to Figure 10 in Struyf et al (1996)
plot(ma)
## One place to see if/how error messages are *translated* (to 'de' / 'pl'):
ani.NA <- animals; ani.NA[4,] <- NA
aniNA <- within(animals, { end[2:9] <- NA })
aniN2 <- animals; aniN2[cbind(1:6, c(3, 1, 4:6, 2))] <- NA
ani.non2 <- within(animals, end[7] <- 3 )
ani.idNA <- within(animals, end[!is.na(end)] <- 1 )
try( mona(ani.NA) ) ## error: .. object with all values missing
try( mona(aniNA) ) ## error: .. more than half missing values
try( mona(aniN2) ) ## error: all have at least one missing
try( mona(ani.non2) ) ## error: all must be binary
try( mona(ani.idNA) ) ## error: ditto
也可以看看
agnes
用於背景和參考; mona.object
、plot.mona
。
相關用法
- R medoids 從聚類中計算 pam 一致的 Medoids
- R summary.clara “clara”對象的摘要方法
- R diana 分裂分析聚類
- R pluton 鈈同位素成分批次
- R votes.repub 總統選舉中共和黨候選人的投票
- R agnes 凝聚嵌套(層次聚類)
- R print.mona MONA 對象的打印方法
- R print.clara CLARA 對象的打印方法
- R plot.diana 分裂層次聚類圖
- R plot.mona 一元分裂層次聚類的旗幟
- R bannerplot 繪圖橫幅(層次聚類)
- R plot.partition 數據集分區圖
- R summary.agnes “agnes”對象的摘要方法
- R pltree 繪製層次聚類的聚類樹
- R summary.mona “mona”對象的摘要方法
- R plantTraits 植物物種性狀數據
- R plot.agnes 凝聚層次聚類圖
- R print.agnes AGNES 對象的打印方法
- R chorSub Kola 數據 C 範圍的子集
- R pam 圍繞 Medoid 進行分區
- R volume.ellipsoid 計算(橢球體的)體積
- R clusplot (分區對象的)雙變量聚類圖
- R print.pam PAM 對象的打印方法
- R clara 集群大型應用程序
- R agnes.object 聚合嵌套 (AGNES) 對象
注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 MONothetic Analysis Clustering of Binary Variables。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。