根据所研究的个体的观测指标来推断该个体所属类型的一种统计方法.9 ?8 T1 ?" E n* P' o W/ f, J) D
$ ]5 A4 V$ ]7 k' d
判别分析(distinguish analysis)是根据所研究的个体的观测指标来推断该个体所属 类型的一种统计方法,在自然科学和社会科学的研究中经常会碰到这种统计问题。例如7 T( G' Y/ ^4 l
$ q% U T5 ]8 a- B7 f' M4 d- G2 ^在地质找矿中我们要根据某异常点的地质结构、化探和物探的各项指标来判断该异常点 属于哪一种矿化类型;5 q& v; R, A' X0 p! r6 @
p5 v9 z; F, N4 u
医生要根据某人的各项化验指标的结果来判断该人属于什么病 症; + D" N% A- K" X% K4 @" } 9 B) S0 \0 _: f, a2 Q: P调查了某地区的土地生产率、劳动生产率、人均收入、费用水平、农村工业比重等 指标,来确定该地区属于哪一种经济类型地区等等。2 e3 T6 m, w* m% k0 N/ a5 [2 f
# ]1 o/ X- b P6 v0 ^& Q
该方法起源于 1921 年 Pearson 的 种族相似系数法,1936 年 Fisher 提出线性判别函数,并形成把一个样本归类到两个总 体之一的判别法。2 s ]4 U, ~4 ?. X K8 p2 |( P
% ` _& _" A/ E3 [3 X
判别问题用统计的语言来表达,就是已有q个总体 ,它们的分布函数分别为 ,每个 都是 p 维函数。对于给定的样本 X ,要判断它来自哪一个总体?当然,应该要求判别准则在某种意义下是优的,例如错判的概率小或错判的损失小等。我们仅介绍基本的几种判别方法,即距离判别,Bayes 判别和 Fisher 判别。9 ^% T0 ]1 _$ ?# c8 |) G
+ J3 x, L, E7 o5 |, |
距离判别 , M% C* D) n4 j' d) c! y) y2 C9 u9 m& b
距离判别是简单、直观的一种判别方法,该方法适用于连续性随机变量的判别类, 对变量的概率分布没有什么限制。* B2 d6 {" O0 G! {2 l