2012年A题思路分析(详细版)个人意见仅供参考
参加过2010年和2011年的国赛,现在已经本科毕业了,这次作为半个局外人,谈一下我对A题的看法。
经过分析,可以认为葡萄酒的质量的评价包括如下方面:
第一问
本问包括两小问:1.1:进行显著性差异分析;1.2:评判结果的可靠性。
1.1只需要对数据进行假设检验就可以了,但是有如下几点需要注意:
(1)缺失数据的处理:常见的处理方法有:【1】删除数据;【2】横向补充数据;【纵向补充数据】。经过对4号评酒员色调的评分和其他9位评酒员进行分析比较,推荐使用纵向补充数据。当然也没有绝对的要求,只是这个数据处理最好说出理由。
(2)假设检验的前提条件:不同的假设检验都需要数据满足一定的规律,例如t检验需要数据数据满足正态分布,使用假设检验,一定要先对数据进行分析。
(3)假设检验可以直接使用SPSS等软件一步到位,但是作为数学建模竞赛,从建模的角度,是利用软件直接给出结果好呢,还是给出相应的数学模型在求解好呢?是一个值得思考的问题
1.2要求我们对结果进行可靠性评判,可能一个很直观的想法就是用两组的组内方差来衡量,看上去有点道理,实际经不起推敲。经过对评酒员的评分进行分析,会发现评酒员在评分方向、评分尺度和评分位置上都有不同,这里可以借鉴置信区间法对数据进行调整,消除评酒员的评分差距,加大酒样间的差距,根据修正前后的组间距即可定义可信度,可信度越高,组间距越小,反之亦然。貌似最后是第二组结果更可靠。
第二问
本问要求根据葡萄的理化指标和葡萄酒的质量对葡萄进行分级。降维是肯定要的,降维之后,通常有如下几种方法:
(1)聚类,根据聚类的结果进行分级
(2)将葡萄酒的质量作为另一个独立的理化指标,建立排序模型(可以参考topsis,层次分析等),给出葡萄的得分,根据得分进行分级。
这两种方法都有自己的优缺点,方法(1)的不足在于缺乏解释,聚类往往通过计算机实现,缺乏分级指标的明确含义;方法 (2)需要赋权,主观性较强。但是这两种方法都是可以避免其缺点的。对于方法(1),可以先对理化指标从化学的角度进行分析(难度较大);对于方法(2),可以建立改进的topsis模型,,改进的topsis不需要直接赋权。
第三问
本问要求分析葡萄和葡萄酒的理化指标之间的关系。很只管的想法是及西宁回归分析,但是貌似拟合结果非常差,他们的相关系数矩阵也惨不忍睹,基于这种情况,可以考虑如下两种方法:
(1)从化学的角度,分析出在葡萄理化指标中,与葡萄酒理化指标分别相关的指标,再进行拟合。方法貌似还可以,但是拟合不好说,因为线性拟合效果肯定是不好的,只有考虑非线性拟合,这时的非线性拟合可不会是二次、三次,很可能是向指数、对数等的拟合。
(2)建立中间变量,如下图所示,从而将多维指标建模转化为单维指标建模,然后进行拟合。利用第二问的topsis排序法进行多维指标到单维指标转化的方法,最后对两者建模,效果还是可以的,这里就不细说了。
第四问
本问也分为两个小问,前半部分和后半部分是相互制约的。第三问做出来了,第四问的前半部分不言而喻,肯定是有关系的,而且可以建立起关系。
那么好,问题的关键来了,附件3芳香物质的梨花指标是用来做什么的?这可让很多同学感到茫然,虽然数学中国有一些答疑,但是很多同学进不去,我也进不去,我也是通过自己的分析猜测出来的。见下图
通俗的讲,评价要综合理性评价(基于理化指标)和感性评级(通过外在感受),在问题3和问题4的前半部分,实际上纯粹是通过理性评价得出来的结果,但是葡萄酒最终是给人品尝的,在实用性角度上,感性评价甚至更重要,芳香物质就是影响感性评价的主要因素,因为芳香物质是用来验证的。
具体而言,基于问题4的前半部分可以得到一个葡萄酒的评价,再利用芳香物质进行建模得到葡萄酒的另一个评价,两种评价方案是否具有一致性是论证的关键。
在这里又产生了2个问题:(1)如何利用芳香物质建模;(2)一致性的定义。这也是值得推敲和琢磨的地方。
个人意见,仅供参考,也欢迎大家相互讨论! 人道主义挽回楼主尊严,消灭零回复 楼主威武!!! 给你回复一个。。。。写的不错,估计今年是帮别人做来。。。要不不会这么详细 第三问用多元线性性回归分析,多变量对多变量线性回归分析,建立模型效果也不错拟合优化度可以到到0.9以上 最后一问的想法和我当时的想法一样,不过没有具体去研究怎么做,嘿嘿。 有理可依。。。 和我做的差不多。。。只是我们的文章最后不够清晰 问题分析得很透彻 ,看了这个,如果论文中的问题分析 写成这样。我想我下次该怎么写问题分析了。谢谢。 有道理,有些地方和我们的思路很相似,但有些地方思路不同!