- 在线时间
- 0 小时
- 最后登录
- 2012-9-17
- 注册时间
- 2012-9-17
- 听众数
- 0
- 收听数
- 0
- 能力
- 0 分
- 体力
- 8 点
- 威望
- 0 点
- 阅读权限
- 10
- 积分
- 3
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1
- 主题
- 1
- 精华
- 0
- 分享
- 0
- 好友
- 1
升级   60% 该用户从未签到 - 自我介绍
- 大家好
 |
1 |; F+ P7 t* N; s3 s
看了几篇关于A题的思路分析,也想说两句,把个人对这个题目的理解和参考解答和大家分享下。
. M/ r w1 @( G8 B+ z
! A9 r& x1 g0 n+ q# o& ]出题原因:一拿到这个题目,感觉怎么今年的CUMCM又来了个关于评价的问题,是不是又是那些老套的模型和思路。但仔细分析题目后发现该题和往年的不同之处:
8 @6 j- s% G& x$ `& \% m6 e1、虽然和往年类似,本题目提供了大量的附件数据,但这些数据都来自实验数据,存在大量的错误、缺失等现象。这在以往建模题目中少见。& O2 F' U7 p. _2 F( @; @
2、指标众多,多数不清楚其机理。由于葡萄酒的理化指标等涉及的专业背景太深,不可能在三天时间内完全了解其指标之间的生理联系,故只能通过数据关系来分析其特点。( c. X3 Y. a7 q% O- S. v
3、应该说建模比了20年,常见的模型、算法和软件大家都掌握得差不多了。这个题目尝试了新的领域,就是关于数学建模在实验科学、实验数据的分析探索,这是继2006年艾滋病评价题目后,又一道关于实验类数据型评价分析题目。但是和艾滋病题目相比,它的数据量更大、更乱,题量也更大,既有基于主观性的评委打分,又有客观的理化指标等。
3 b* {% B E7 G/ q0 q6 Y, o6 k4、本题的科研特色较强。查阅了关于葡萄酒评价方面的科技文献,像问题三,分析理化之间的联系这种问题其实在葡萄酒评价科研领域都还没有完全成熟的方法,学术界对理化指标之间的关系都没有定论,所以这就意味着本题科研探索的味道更浓;但另一方面也说明了,这种探索也没有对结果的要求,只要言之合理的结果都OK。' j1 y2 R: z4 l! @' ~. z- I
% T( Q* ?$ v/ i! W4 Y本题目失败之处:查阅了关于葡萄酒评价的各类科技文献,其实用数学模型方法研究该问题的文献很少,或者很雷同。出题人估计希望全国的参赛队用数学模型创造性的去研究该问题,得到研究葡萄酒评价问题的定量研究方法。但是对于一个普通本科生来说,这种数据评价的题目,特别涉及到数理统计、多元统计等方面的模型,其实欠缺的数学基础还很多,大多数同学连置信区间、参数检验的条件等都不清楚,很难在三天内求出很深刻的结果。所以很多同学都在“套”模型,因子、聚类、回归等这些数据评价模型都基本上全部出现在了论文中,就是放的顺序不同而已,实在很难辨别水平的高低。' G4 W3 L7 p; `" ~% v$ F
2 g, Q D; |8 D8 B3 m问题一:有两个工作要做' T, O- |. s3 r" j
工作1:两组评价员的评价结果有无显著性差异。其实,这句话有歧义,也是建模常玩的花样。到底是基于针对某种具体酒去检验结果有无差异,还是从整体上去分析差异性。理解的不同,会导致处理数据对象也不同。由于本题是问有无显著性差异,因此应该寻求统计意义下的差异,而不是简单的数值大小差异。因此,T检验、方差分析等都登场了。但如果按照严格的方法使用条件,用参数检验方法样本要服从或近似服从正态分布,方差分布不仅如此,还要进行方差齐性检验等;如果这些检验通不过,那就要寻求非参数检验方法。但是“非参数检验”,天啊,对于一个本科生,这个要求是不是太高了?目前主流的国内建模教程,都没有相关内容,感觉是不是竞赛都黔驴技穷了?9 v# X% h. ]) w2 ~ E4 ^
不仅如此,很多人选取了独立样本T检验。其实,应该选择配对样本T检验,因为是同一样本的两组人员,他们的结果是有关联的。
+ a+ O- t3 ^8 e! ~! y" W2 }" {- ? 工作2:哪一组结果更可信。这个题目辨别可信,但什么叫可信?这个概念在统计学中都没有精确的定义。因此必须建立在对这个概念界定的基础上进行讨论。很多同学都选择方差等指标来描述这种可信,因为他们认为方差越大,说明该组成员得分的波动幅度越大, 结果越不一致,越不可靠。但我觉得这种方法不妥。因为不同评委之间打分的严格和宽松程度是不同的,比如下列
1 x4 I/ X, O' Z4 R$ | p 评委1 80 70 60
" C% n' Y0 d$ h7 n% \5 v! F 评委2 90 70 50
2 U) f! J8 P( `; m4 S. L9 a 可以看到评委2的得分波动幅度更大,你能说他的结果更不可信?从数据观察看到,他们得分的高低顺序是完全一致的,只是打分高低不同而已,即第一名、第二名和第三名完全相同。但是只是简单的使用原始数据进行方差计算,得到的结果是和实际情况不吻合的。两者打分应都完全一致。所以个人建议该使用非参数统计中的秩统计量去研究,例如FRIDMAN 或KENDALL去检验评委们之间的一致性,这样就能够避免因为这种因为打分尺度不同造成的影响。 : T. p3 |) D6 z/ _
# R1 r! w R/ Z% [
累了,今天到这来,有人气就继续写
- L7 T2 |6 V/ H1 \ - _4 ]% @1 h3 j9 n$ n
. z4 W5 Q8 R. u5 J. p0 Z: ]. x' m |
zan
|