fanny
位於 cluster
包(package)。 說明
將數據的模糊聚類計算為 k
聚類。
用法
fanny(x, k, diss = inherits(x, "dist"), memb.exp = 2,
metric = c("euclidean", "manhattan", "SqEuclidean"),
stand = FALSE, iniMem.p = NULL, cluster.only = FALSE,
keep.diss = !diss && !cluster.only && n < 100,
keep.data = !diss && !cluster.only,
maxit = 500, tol = 1e-15, trace.lev = 0)
參數
x |
數據矩陣或 DataFrame ,或相異矩陣,具體取決於 對於矩陣或 DataFrame ,每行對應一個觀察值,每列對應一個變量。所有變量都必須是數字。允許缺失值 (NA)。 在相異矩陣的情況下, |
k |
給出所需簇數的整數。需要 ,其中 是觀測值數量。 |
diss |
邏輯標誌:如果為 TRUE( |
memb.exp |
number |
metric |
字符串,指定用於計算觀測值之間差異的度量。選項有 |
stand |
邏輯性;如果為真,則在計算差異之前對 |
iniMem.p |
數值 |
cluster.only |
邏輯性;如果為 true,則不會計算並返回任何輪廓信息,請參閱詳細信息。 |
keep.diss , keep.data |
邏輯指示是否應將差異和/或輸入數據 |
maxit , tol |
FANNY 算法的最大迭代次數和默認收斂容差(擬合標準的相對收斂)。默認值 |
trace.lev |
指定 C-internal 算法期間打印診斷的跟蹤級別的整數。默認 |
細節
在模糊聚類中,每個觀察值都是各個聚類上的“spread out”。用 表示觀察 到聚類 的成員資格。
隸屬度是非負的,對於固定觀察 i,它們的總和為 1。特定方法 fanny
源自 Kaufman 和 Rousseeuw (1990) 的第 4 章(請參閱 daisy
中的參考文獻),並已由 Martin Maechler 擴展為允許用戶指定 memb.exp
、 iniMem.p
、 maxit
、 tol
等。
Fanny 的目標是最小化目標函數
其中memb.exp
和 是觀察值之間的差異 和 .
注意 給出越來越清晰的聚類,而 導致完全模糊。 K&R;(1990), p.191 指出,值太接近 1 會導致收斂緩慢。進一步注意,即使是默認值, 可能導致完全模糊,即隸屬度 。在這種情況下,會發出警告信號,建議用戶選擇較小的memb.exp
( )。
與其他模糊聚類方法相比,fanny
具有以下特點: (a) 它還接受相異矩陣; (b) 它對 spherical cluster
假設更加穩健; (c) 它提供了一種新穎的圖形顯示,即輪廓圖(參見plot.partition
)。
值
代表聚類的 "fanny"
類的對象。有關詳細信息,請參閱fanny.object
。
例子
## generate 10+15 objects in two clusters, plus 3 objects lying
## between those clusters.
x <- rbind(cbind(rnorm(10, 0, 0.5), rnorm(10, 0, 0.5)),
cbind(rnorm(15, 5, 0.5), rnorm(15, 5, 0.5)),
cbind(rnorm( 3,3.2,0.5), rnorm( 3,3.2,0.5)))
fannyx <- fanny(x, 2)
## Note that observations 26:28 are "fuzzy" (closer to # 2):
fannyx
summary(fannyx)
plot(fannyx)
(fan.x.15 <- fanny(x, 2, memb.exp = 1.5)) # 'crispier' for obs. 26:28
(fanny(x, 2, memb.exp = 3)) # more fuzzy in general
data(ruspini)
f4 <- fanny(ruspini, 4)
stopifnot(rle(f4$clustering)$lengths == c(20,23,17,15))
plot(f4, which = 1)
## Plot similar to Figure 6 in Stryuf et al (1996)
plot(fanny(ruspini, 5))
也可以看看
agnes
用於背景和參考; fanny.object
、partition.object
、plot.partition
、daisy
、dist
。
相關用法
- R flower 花卉特征
- R summary.clara “clara”對象的摘要方法
- R diana 分裂分析聚類
- R pluton 鈈同位素成分批次
- R votes.repub 總統選舉中共和黨候選人的投票
- R agnes 凝聚嵌套(層次聚類)
- R print.mona MONA 對象的打印方法
- R print.clara CLARA 對象的打印方法
- R mona 二元變量的單論分析聚類
- R plot.diana 分裂層次聚類圖
- R plot.mona 一元分裂層次聚類的旗幟
- R bannerplot 繪圖橫幅(層次聚類)
- R plot.partition 數據集分區圖
- R summary.agnes “agnes”對象的摘要方法
- R pltree 繪製層次聚類的聚類樹
- R summary.mona “mona”對象的摘要方法
- R plantTraits 植物物種性狀數據
- R plot.agnes 凝聚層次聚類圖
- R print.agnes AGNES 對象的打印方法
- R chorSub Kola 數據 C 範圍的子集
- R pam 圍繞 Medoid 進行分區
- R volume.ellipsoid 計算(橢球體的)體積
- R clusplot (分區對象的)雙變量聚類圖
- R print.pam PAM 對象的打印方法
- R clara 集群大型應用程序
注:本文由純淨天空篩選整理自R-devel大神的英文原創作品 Fuzzy Analysis Clustering。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。