数学建模————统计问题之评价(三)& u6 M! U- ^! h% w- }
评价一般用来评估某件事物的成绩、水平或程度。通常每个个体都有多个不同的指标去衡量,除开数据的预处理之外,评价的过程可分为三大步: 3 u4 l. s5 E/ d! E4 a7 m' c$ b8 q8 t+ M' F# K, D: q' {
一对于每个指标给每个个体打分;' R- J$ r: C, X0 c
# B* P" ^, h% k; W
二赋予每个指标一个权重; - k' b* r1 d8 t0 ~; o& E( y. ~0 S" ]( t% f. g
三根据权重将指标得分综合起来,从而获得该个体的综合评价。' u! r& H: G9 X! j; ?
. U0 L) d8 E0 F 常见的评价算法有:TOPSIS理想解法、模糊综合评价、层次分析法、熵权法、秩和比综合评价、灰色关联分析、粗糙集综合评价、主成分分析法等。这些算法根据上面的三个步骤可以分为客观评价和主观评价两个大类。5 R j* {5 ^% m) i
6 \0 g3 o7 x' |
' o3 I3 u) g9 X" ~
5 l% S0 ^* \1 I# k' J; a2 c
Step1 首先是指标的给分,除非国际或者相关领域有着标准的给分,比如:每一级水质中各成分的含量都有一个标准,那么根据这个标准,我们就可以将各个成分指标划分到各自的级别。除开这种有标准的情况,评价算法中还有所谓的专家打分机制(其实大多数情况也是自己打分的,即自己给每个指标一个评分标准,然后根据这个人造标准来打分zz),从而完成第一步,使用这种专家打分方法的有模糊综合评价、层次分析法、秩和比综合评价、粗糙集法。/ o# C h f& k! r& m
* t# E" k- e7 C b/ I. K6 H 当然也有客观的评分机制,比如说TOPSIS理想解法和灰色关联度法,这两种方法是将每个指标中的最好数据合并,作为理想解,然后比较各个样本与它的距离或者相关性,从而进行评价。 0 x$ C- |! R7 k& g Z4 e8 Y0 L6 d5 t, U! ~! u
8 g4 ^( z, V0 b6 ^* M7 N
! t3 D; C5 e9 g2 a G' o, O3 f& Q
Step2 接下来就是指标权重的确定,同样也分为主观定权和客观定权两种,上一步说的TOPSIS理想解法和灰色关联度法没有这一步,所以不考虑。 9 V8 m+ a+ X" V" ~4 e; d 主观定权的方法有层次分析法、模糊综合评价、秩和比综合评价,看起来好像跟上一步主观定权的一样,但是还有一个方法在这一步变成了客观定权,即粗糙集综合评价,因为这个方法可以通过一个公式计算出每个指标的有无对结果的影响,从而确定每个指标的权重。9 i0 ?+ \( J* S( b% C4 ^( N
关于客观定权,还有熵权法(指标内数据结构越复杂权重越大)、主成分分析。 6 }% I7 y n5 Z9 t# V G: W7 M$ B2 H- x. R% [) q 主成分分析(通过对多个指标的不同加权组合来表达原数据的结构,即降维,每个组合的贡献率就是其权重),这类算法的定权方式实质上就是如果某一指标内个样本的区别越大,该指标的权重就越大。 8 d7 i# E- [( C2 \ 5 c% f9 ^7 M& Z" O M `7 L$ h6 K3 J% L; |9 f/ z [! }
Step3 最后一步是综合评价,就是将第一步各指标的分数与第二步的权重进行加权平均,就可以得到最终的评价。后文将以模糊综合评价为例进行讲解。 6 L5 v3 g U7 _* l* _/ J& Y- K% ~% ]8 E) K- ^- W, N
8 b6 F% q9 [8 r1 f* s 以上这些算法在比赛中可以尝试进行组合,因为前两个步骤都存在主客观的问题,所以可以尝试用专家打分方法完成第一步,客观定权方法完成第二步。 : K3 N, L' R8 S" u. W- r; I% M0 H K
正如我在前文所说到的,在做评价问题时,我们可以利用客观定权和主观评分的方式来进行评价,这样的合理性和效果往往会比单一方法的效果好。这里,我就拿熵权法和模糊综合评价的结合来讲,不过该例子中评价步骤经常用于对个体的评价,而很少用于对多个个体的评价排序,如果想用可以修改一下过程。 * c& f3 S9 S7 B' e0 u4 V9 R $ `5 o. F6 a* E1 T: L. O C8 D! ^7 y, a* G- [例:现有一面试小组对某人知识面、理解能力、应变能力和表达能力的评价表,请根据此表给此人一个综合评价。 8 c) p( E$ R! g: w( }3 Z9 w) `. @& [" t7 V j: p
\+ r; ~3 G$ H. p9 D0 e, U5 G3 H P4 r ?
确定因素集,这里已经有现成的四个评价指标了,即知识面,应变能力,表达能力和理解能力;/ t# F: Z$ Y7 k/ t
确定评语集,这里就需要我们自己划分等级了,比如说最简单的:" S' u* O2 D# W' z& ^, v# J" {
确定各因素权重,这里我们采用熵权法进行客观定权: 3 R+ S# f Q M- w+ q, g! h 第一步,数据标准化,即去除数据量纲,所以我们要将每一个指标下的10所有10个数据转化到[0,1]之间,用的公式是: # X( O# C0 t1 d v& ~$ b# i& |! U0 [; H5 x7 @& B
0 i& } P1 t6 E) k8 b, M
第二步,根据信息熵公式计算各指标的信息熵(如果p值为0,那么plnp=0): ( Z2 T0 C' `* N4 g/ @9 p8 [. q/ O7 f3 w/ m
0 t% b$ g u0 {7 G* [ ! }; S; C& A3 H7 \% I6 z9 p. _1 m( n! \" [: D7 w0 z. B
4 u* x- A9 K! z( C! _# \
第三步,根据指标权重计算公式公式计算各指标的权重:* Z$ Y* W, J! f& d' a
8 k5 c# o- S7 Z7 I) `9 s% ^
$ M* |' W- Q f6 x$ D ; B5 c8 v2 K1 ^7 j/ C9 `8 U" u 到这一步,各指标的信息熵和权重就得到了: 5 ]$ m" ~& n5 c7 F" q, W6 ^ " \0 t4 g3 W! a' O' Z; h( d- |/ Y8 p
`: R3 W$ Z3 m! Z( K" A 确定模糊综合判断矩阵,这一步我们先要将每个分数划分到各自的等级中,因此该评分表可以改成: ) {. |! D0 K0 W( C; U$ }( w" ~ 由此可得模糊综合判断矩阵: 3 l6 {) L6 D+ P' f' i' M1 Y) Y6 f$ L; ^- y( a
$ Z3 L/ k9 I2 r" Z% M 这个矩阵应该一行行去理解,比如说第一行,这代表着知识面这一指标中有70%的人认为此人的等级为A,30%的人认为此人的等级为B,以此类推可得。 4 S3 N |* d! h. n- U: z; [! o4 w7 I% {4 ?4 E
模糊综合评判,这一步我们直接将上面的矩阵与权重合成运算.0 @/ z( p* `5 A* U
2 B( \! D1 T! @0 J' `8 J
: }. J- T3 a+ z: W 可以发现0.3741最大,也就是说此人在等级B的隶属度最高,因此最终给此人评价为B。 ! p1 E, a$ i& J7 S: h! v + }; _* S1 u. Y1 i/ H: W; o, g9 R k0 x8 D6 h5 X