) ?" ]3 i4 }: ^' S! S. w! L* d本题目失败之处:查阅了关于葡萄酒评价的各类科技文献,其实用数学模型方法研究该问题的文献很少,或者很雷同。出题人估计希望全国的参赛队用数学模型创造性的去研究该问题,得到研究葡萄酒评价问题的定量研究方法。但是对于一个普通本科生来说,这种数据评价的题目,特别涉及到数理统计、多元统计等方面的模型,其实欠缺的数学基础还很多,大多数同学连置信区间、参数检验的条件等都不清楚,很难在三天内求出很深刻的结果。所以很多同学都在“套”模型,因子、聚类、回归等这些数据评价模型都基本上全部出现在了论文中,就是放的顺序不同而已,实在很难辨别水平的高低。$ Y% g. U" D; V q5 d {8 u6 }2 g
, ?# [, C4 W" D& J问题一:有两个工作要做 ! @) F y9 |$ b' D8 D# m& r 工作1:两组评价员的评价结果有无显著性差异。其实,这句话有歧义,也是建模常玩的花样。到底是基于针对某种具体酒去检验结果有无差异,还是从整体上去分析差异性。理解的不同,会导致处理数据对象也不同。由于本题是问有无显著性差异,因此应该寻求统计意义下的差异,而不是简单的数值大小差异。因此,T检验、方差分析等都登场了。但如果按照严格的方法使用条件,用参数检验方法样本要服从或近似服从正态分布,方差分布不仅如此,还要进行方差齐性检验等;如果这些检验通不过,那就要寻求非参数检验方法。但是“非参数检验”,天啊,对于一个本科生,这个要求是不是太高了?目前主流的国内建模教程,都没有相关内容,感觉是不是竞赛都黔驴技穷了?% r$ K3 N% a3 E1 `
不仅如此,很多人选取了独立样本T检验。其实,应该选择配对样本T检验,因为是同一样本的两组人员,他们的结果是有关联的。3 C, f/ |0 V$ D* Z
工作2:哪一组结果更可信。这个题目辨别可信,但什么叫可信?这个概念在统计学中都没有精确的定义。因此必须建立在对这个概念界定的基础上进行讨论。很多同学都选择方差等指标来描述这种可信,因为他们认为方差越大,说明该组成员得分的波动幅度越大, 结果越不一致,越不可靠。但我觉得这种方法不妥。因为不同评委之间打分的严格和宽松程度是不同的,比如下列 5 M1 U3 Q2 a$ c6 L9 N8 O 评委1 80 70 605 S a3 n7 {( R* |3 S
评委2 90 70 50+ L q+ ~2 E$ l9 \5 k8 w
可以看到评委2的得分波动幅度更大,你能说他的结果更不可信?从数据观察看到,他们得分的高低顺序是完全一致的,只是打分高低不同而已,即第一名、第二名和第三名完全相同。但是只是简单的使用原始数据进行方差计算,得到的结果是和实际情况不吻合的。两者打分应都完全一致。所以个人建议该使用非参数统计中的秩统计量去研究,例如FRIDMAN 或KENDALL去检验评委们之间的一致性,这样就能够避免因为这种因为打分尺度不同造成的影响。 9 X$ Y5 \/ l* }* c9 M3 S- f
# w$ M' [ L ?& y8 o' Z
累了,今天到这来,有人气就继续写4 p+ l$ l8 C a4 z1 w
5 R5 P' M7 D) N& B; T