在工程技术和经济管理中,常常需要对某些指标按照一定的标准(相似的程度或亲 疏关系等)进行分类处理。例如,根据生物的某些性态对其进行分类,根据空气的性质 对空气质量进行分类,以及工业上对产品质量的分类、工程上对工程规模的分类、图像 识别中对图形的分类、地质学中对土壤的分类、水资源中的水质分类等等。这些对客观 事物按一定的标准进行分类的数学方法称为聚类分析,它是多元统计“物以聚类”的一种分类方法。然而,在科学技术、经济管理中有许多事物的类与类之间并无清晰的划分, 边界具有模糊性,它们之间的关系更多的是模糊关系。对于这类事物的分类,一般用模糊数学方法、我们把应用模糊数学方法进行的聚类分析,称为模糊聚类分析。 ' X* l0 v5 i4 t1 P 4 k" U7 C8 U& z B. e& Q4 c4 D! X1 预备知识7 }. \. q% c: D# T
1.1 模糊等价矩阵& M0 C; }& _1 _% w$ R
* o5 X1 Q, O! W& p3 j& m/ X) b0 O' f" B+ ^; ~$ v8 Y
; x- `+ Z- V# U5 i% b4 l
$ k7 x7 m. V- z `$ R
n 阶等价布尔矩阵 ; w1 m/ R, y5 p" h * [) ?1 a! A+ `: [: }) F' [: S. o" L* w* n
' c) M! t" D5 h+ C, `2 ~& Y ~: D& M
* R1 o! Q( b% f9 q. B
(13) 主观评分法; v/ m, a* ~% _& `( Q3 [9 k
/ ?5 ]1 o" b. g' l# b) u
' x) q# ~* ~/ W7 H6 t5 g' ^( k
$ f Y) @9 r" E
Step3: 聚类 " r/ z) m8 ?8 ?$ f: _# ?所谓聚类方法就是依据模糊矩阵将所研究的对象进行分类的方法。对于不同的置信 水平λ ∈[0,1],可以得到不同的分类结果,从而形成动态聚类图。常用的方法如下:0 v3 D0 [% {$ `2 n) c" W6 ~& S
' f q* S& Q" {" y3 e+ |3 A
(1) 传递闭包法 ! @. _; I; V- W- M从 Step2 中求出的模糊相似矩阵 R 出发,来构造一个模糊等价矩阵 。其方法就 是用平方法求出 R 的传递闭包t(R) ,则 t(R) = ;然后,由大到小取一组λ ∈[0,1] , 确定相应的λ 截矩阵,则可以将其分类,同时也可以构成动态聚类图。 / t% L8 {* c" V' W) {$ G) k0 {
(2) 布尔矩阵法 ] R7 h- `- `, f 4 K& R& u4 _% p* t * P8 g9 \: \; Z* i( } + X* @ z [* q 6 v3 p- o! v0 E/ P4 U2 | / k5 o) n$ H3 u(3) 直接聚类法 8 ]0 B. g% x0 B此方法是直接由模糊相似矩阵求出聚类图的方法,具体步骤如下:; }4 e* N' O% O2 i# @0 v
' ~& ]! O! v, |- s9 S) q% o' j- O8 P" j: q6 N
8 @0 Q A. s, P. B. A m* g
3 模糊聚类分析应用案例 9 t! L( _6 T( l L! x2 _例 15 某地区内有 12 个气象观测站,10 年来各站测得的年降水量如表 3 所示。 为了节省开支,想要适当减少气象观测站,试问减少哪些观察站可以使所得到的降水量 信息仍然足够大? 9 L% e9 T! R' k- l! W, |0 r- { q- h: F$ _( ^. L; O
. l% g8 J. Q: P! G ^( u; O7 f4 t3 n9 U/ e* X6 p0 G7 a" M' }
9 D* T9 _' E X6 T0 v4 N: f. g
解 我们把 12 个气象观测站的观测值看成 12 个向量组,由于本题只给出了 10 年 的观测数据,根据线性代数的理论可知,若向量组所含向量的个数大于向量的维数,则 该向量组必然线性相关。于是只要求出该向量组的秩就可确定该向量组的最大无关组所 含向量的个数,也就是需保留的气象观测站的个数。由于向量组中的其余向量都可由极 大线性无关组线性表示,因此,可以使所得到的降水信息量足够大。% [4 [: ^0 x. j1 h, j) q3 [. O
3 O2 p* e1 {- b: S) C- W
( @& p6 b* f% v6 c
3 f) g* Q8 K" v到目前为止,问题似乎已经完全解决了,可其实不然,因为如果上述观测站的数 据不是 10 年,而是超过 12 年,则此时向量的维数大于向量组所含的向量个数,这样的 向量组未必线性相关。故上述的解法不具有一般性,下面我们考虑一般的解法,首先, 我们利用已有的 12 个气象观测站的数据进行模糊聚类分析,最后确定从哪几类中去掉 几个观测站。 9 m/ K) p: m; R. m } " ]4 ]* u: ?$ k. V' Z& R(1)建立模糊集合 X' Y y. Y5 n/ g6 M
' T g& ?0 D; ]& D; s
" A+ a) r# K& z; p
^' ^3 p6 f L ' E( t8 Q$ n8 y" p G4 [( W8 d( b
5 Z$ b6 M- w4 Q% K3 C4 j- ~
(2)利用格贴近度建立模糊相似矩阵/ F" e' W* m7 W; j$ f G8 o$ w$ H
( N0 j2 k$ E6 E0 V5 a
$ z: d* o, i; ?: z$ l7 g
& A+ V, A2 G% l& F. N
(3)求 R 的传递闭包 , |& g: f1 L3 `; S/ p, d( k & }% o8 y4 c) ?% U( Y( n; F: M* o0 G7 R: \. ?: H
5 Q' _( f" q: B/ E ) T3 a. l* K7 n9 g. ~ ( P: b) x3 c( x! n+ M P , q0 o' m+ o& o3 q % ?$ Z m! { c( T3 M/ d: m8 o(5)求解的 MATLAB 程序如下:, I; f c5 K3 D+ x- b) l
5 O" E6 k' a( a. I+ V' k: `i)求模糊相似矩阵的 MATLAB 程序' t6 t% b. p. D, X# l