' S% R+ r& C6 `8 h前面已选取了特征参数,把特征参数张成的多维空间称为特征空间.分类决策就是在特征空间中用统计的方法把被识别对象归为某一类别.基本作法是在学习样本集的基础上确定某个判决规则,使按这种判决规则对被甄别对象进行分类所造成的错误识别率最小或引起的损失最少. + a; `1 q2 H- L9 Q这里,我们的分类决策选取Fisher线性判别法.即选取线性判别函数U(x),使得:% G) H& \. f4 a9 `" H Q- d
U(x)={E1[U(x)]-E2[U(x)]}2/{D1 [U(x)]+D2[U(x)]}=max (1)9 q+ f9 U4 c/ N8 N$ Q
其中Ei与Di分别表示母体i的期望和方差运算,i=1,2. ; K0 N# u' i' r6 y(1)式的含义是:构造一个线性判别函数U(x)对样本进行分类,使得平均出错概率最小.即应在不同母体下,使U(x)的取值尽量分开.具体地说,要使母体间的差异 (E1(U(x))-E2(U(x)))2相对于母体内的差异D1[U(x)]+D2[U(x)] 为最大.取 3 n1 b: a3 l) p. ?/ ] U(x)=( 1- 2)T(∑1+∑2)-1X 2 A+ v9 T! D. E4 h) I, v 就可满足(1).其中 i为第i类母体的均值矩阵的估计,∑i为第i类母体的方差矩阵的估计.取分类门槛值为:" F- D) L! S% u! h8 h+ B
U0=U(α* 1+(1-α)* 2)4 B# ?2 w t/ @- S* U7 v
其中0<α<1,本问题中两类样本的个数相等,可取 α=1/2.若U( 1)>U0,U( 2)<U0 , 则当U(X)>U0., 就认为X取自母体1;当U(X)<U0, 就认为X取自母体2.) X9 j) i, K* ?$ H
用上面得出的4个主成分构成的特征组和此分类决策,对20个学习样本进行分类,能得出正确的结果.但是,若取W=(r1,r2,r3),求Y=XW,以Y的3个分量作为特征参数向量,再用Fisher线性判别法对20个学习样本进行分类,则第四个样本不能正确分类. , ~$ W2 Y# c& J2 M因此,得出分类的数学模型为:# e/ T+ R+ d1 i4 |1 D
(1) 特征选取:取W=(r1,r2,r3,r4),求Y=XW,得出特征参数向量就是Y的4个列向量.其中X是反映20个学习样本的41个特征的随机向量.; |, n0 O- }1 L% }
(2) 分类决策:Fisher线性判别法. 5 J1 ?: X& B: n# U1 L- l' {9 h$ t# Z; I2 X) T9 M% Z1 s
/ f0 w0 d- w$ U8 j: O, ^8 S
(三)分类模型的有效性考察# K1 _7 Z# \' v5 q9 A8 B
" g8 o4 C, ?' z) T: s1 i前面建立的分类数学模型对20个学习样本进行了正确分类.为了进一步考查分类模型的有效性和可靠性,我们采用的方法是:预先留一部分学习样本不参加训练,然后用分类决策模型对其作预报,将预报成功率作为预报能力的指标.! A# ]0 ]' q# k7 a* M1 ^1 V
每次取出一个学习样本,以其余学习样本作训练集,用分类决策模型对取出的一个样本作预报,同时对给出的后20种样本作预报.结果见表4.# i, ~. {6 [( p9 p K
|) c& A6 ?# s4 r' d
# p1 r! f7 l+ o8 ^, j! l
& T0 k; U1 w3 W- y X' F0 |+ u; y' x5 M- a+ l) P表 4 ; r5 B8 l3 i- c, X4 \, d取出样品序号 取出样本类别预报 后20组样本中A类序号预报; b& ?1 ~8 @ i: G2 |& p
1 A 22,23,25,27,29,34,35,36,37 5 _2 I: l4 c$ V$ [/ i 2 A 22,23,25,27,29,34,35,36,373 p* u+ d5 E: I* A1 S
3 A 22,23,25,27,29,34,35,36,37 % _5 p3 _; @* ~- @: ]
4 A 23,25,27,29,34,35,36,37 * F( `. t' a$ U5 ~( S P0 w 5 A 22,23,25,27,29,34,35,36,37 ! U. [9 g+ _6 J 6 A 22,23,25,27,29,34,35,36,37 , I0 G7 z& f+ d' y! z 7 A 22,23,25,27,29,34,35,36,37 9 K E( O) C' T& |! E 8 A 22,23,25,27,29,34,35,36,37 ' B! |1 B% O Y4 r1 W 9 A 22,23,25,27,29,34,35,36,37) L* G+ M/ Y5 m
10 A 22,23,25,27,29,34,35,36,37 5 ^# f* `/ Y7 Q+ l+ }4 C- K- K 11 B 22,23,25,27,29,34,35,36,37! Z- ?: \) D" F3 s) ]$ R- P$ ?
12 B 22,23,25,27,29,34,35,36,373 e/ L0 ?( R! y
13 B 22,23,25,27,29,34,35,36,37 8 A+ w& \! V. h5 {; A3 V. l 14 B 22,23,25,27,29,34,35,36,376 W' ^- ?' D) _$ Y" O
15 B 22,23,25,27,29,34,35,36,37,39, k4 |; d. |3 ^+ Q/ ?
16 B 22,23,25,27,29,34,35,36,37$ P' b' ]* f) h" o! j- N* h( c
17 B 22,23,25,27,29,34,35,36,37,30,39 / B H h" r! z! p' t- Z( p 18 B 22,23,25,27,29,34,35,36,37$ ~* y& a0 G: ~9 Q. Y
19 B 22,23,25,27,29,34,35,36,37 0 N# Y6 p' r) y! d1 ~6 _+ E 20 B 22,23,25,27,29,34,35, 37" d6 g: |0 r+ v# p0 w$ m
/ I5 z0 H0 R$ v从表4可以看出: 8 S' q! c1 C& Y$ R; x$ Z1. 每次取出一个学习样本,以其余学习样本作训练集,用分类模型对该学习样本的预报的成功率是100%. * O- b- X+ Q E. t2. 每次取出一个学习样本,以其余学习样本作训练集,用分类模型对未知类别的第21~40个样本进行预报,其结果有以下特点:/ X- M9 L9 t5 [3 o' {! W0 U
(1) 除分别取出4、15、17,20的预报结果不同外,分别取出其余16中一个,预报结果均为:22,23,25,27,29,34,35,36,37,占80%.# N6 n3 w( _; A2 P. e9 a. W, G" b
(2) 分别取出4、15、20的预报结果,与(1)的结果相比,只有一个样本的差异,占15%.+ F6 X1 U/ @8 X- y4 e S) R
(3) 取出17的预报结果,与(1)的结果相比,有两个样本的差异,占5%.; w( n8 }; d" [0 L1 l% x) l
第一种结果和第二种结果非常接近,合计占总数的95%.只有第三组的这一个结果有较大差异,占总数的5%. : z" i" \$ l- O: T2 h; ]2 f5 a' r由以上检验得出结论:所建立的分类数学模型分类效果很好.# p# L: s# t; |4 O6 J
' r' `4 f, E/ O# B- v) n$ B4 w7 ](四)未知样本的预报 6 \" F: I: b7 b) k5 ?现在用前面建立的数学模型对题目所给的未知类型的20个人工序列和182个自然序列进行预报.(程序见附录三) 1 K0 S: v7 Y# @+ E& g结果为:9 Q0 L$ x& H9 h. J7 \# c
1) 20个人工序列的类别' X+ s e& t, p# ^2 G6 V) o
A类:22,23,25,27,29,34,35,36,37 h% V4 Q1 ^5 \2 v9 V e. {6 n _& Z% ZB类:21、24、26、28、30、31、32、33、38、39、407 g" m, {: [' a# f+ }+ Q# U" u
2) 182个自然序列的类别# O/ E4 f$ E. M; M9 X+ B* E- B
A类:(共142个)2,3,5,6,7,9,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,28,30,31,33,34,35,36,37,38,39,40,42,44,45,46,47,49,50,51,52,53,55,56,57,58,59,60,61,62,64,65,66,67,68,69,71,73,74,77,78,79,80,82,83,84,85,87,88,89,91,93,94,95,96,97,98,99,100,101,103,104,105,106,107,108,109,111,112,113,114,115,117,118,120,121,122,123,124,125,127,128,129,130,132,133,134,135,136,137,138,139,140,141,142,143,145,146,147,148,149,151,152,153,154,155,156,158,167,168,171,172,173,174,175,176,177,178,179,180,181) ^: X0 \* q3 K
B类:(共40个)1,4,8,10,27,29,32,41,43,48,54,63,70,72,75,76,81,86,90,92,102,110,116,119,126,131,144,150,157,159,160,161,162,163,164,165,166,169,170,182' D$ w. d# B/ Z3 g9 B