数学建模社区-数学中国

标题: 2012年A题思路分析(详细版)个人意见仅供参考 [打印本页]

作者: 安树庭    时间: 2012-9-11 10:28
标题: 2012年A题思路分析(详细版)个人意见仅供参考

  J: R( K  g0 t, i  a! h2 a        参加过2010年和2011年的国赛,现在已经本科毕业了,这次作为半个局外人,谈一下我对A题的看法。5 h- f$ K) `0 }0 s0 P
经过分析,可以认为葡萄酒的质量的评价包括如下方面:0 u" ~: j7 K1 B/ Z' ~5 A
葡萄酒评价.jpg 3 R1 V! A9 k2 T0 L
  n8 g1 X; H3 S5 s9 o+ J4 Z
第一问9 l+ J' l8 c0 Y, Y  {
        本问包括两小问:1.1:进行显著性差异分析;1.2:评判结果的可靠性。
) Z  a* v. ?$ O0 I1.1只需要对数据进行假设检验就可以了,但是有如下几点需要注意:
' g# M+ m0 A# p- O0 c: s) e    (1)缺失数据的处理:常见的处理方法有:【1】删除数据;【2】横向补充数据;【纵向补充数据】。经过对4号评酒员色调的评分和其他9位评酒员进行分析比较,推荐使用纵向补充数据。当然也没有绝对的要求,只是这个数据处理最好说出理由。( y& M7 ?+ Y# u# ^
    (2)假设检验的前提条件:不同的假设检验都需要数据满足一定的规律,例如t检验需要数据数据满足正态分布,使用假设检验,一定要先对数据进行分析。
1 \- c0 E8 P+ F; V$ e7 }1 Q, Q; ^    (3)假设检验可以直接使用SPSS等软件一步到位,但是作为数学建模竞赛,从建模的角度,是利用软件直接给出结果好呢,还是给出相应的数学模型在求解好呢?是一个值得思考的问题
& O5 F8 |" E/ r9 U6 B1.2要求我们对结果进行可靠性评判,可能一个很直观的想法就是用两组的组内方差来衡量,看上去有点道理,实际经不起推敲。经过对评酒员的评分进行分析,会发现评酒员在评分方向、评分尺度和评分位置上都有不同,这里可以借鉴置信区间法对数据进行调整,消除评酒员的评分差距,加大酒样间的差距,根据修正前后的组间距即可定义可信度,可信度越高,组间距越小,反之亦然。貌似最后是第二组结果更可靠。
: S1 p9 I' {, @0 z& F+ n( l0 l+ R第二问) c- f" m0 q9 Q* U0 h
        本问要求根据葡萄的理化指标和葡萄酒的质量对葡萄进行分级。降维是肯定要的,降维之后,通常有如下几种方法:- J/ ?3 o! m5 K/ y8 e
    (1)聚类,根据聚类的结果进行分级
6 O7 c- R) S9 f; i/ E! ~4 H! B    (2)将葡萄酒的质量作为另一个独立的理化指标,建立排序模型(可以参考topsis,层次分析等),给出葡萄的得分,根据得分进行分级。7 C: S& e# u9 ^/ M& r' x
这两种方法都有自己的优缺点,方法(1)的不足在于缺乏解释,聚类往往通过计算机实现,缺乏分级指标的明确含义;方法 (2)需要赋权,主观性较强。但是这两种方法都是可以避免其缺点的。对于方法(1),可以先对理化指标从化学的角度进行分析(难度较大);对于方法(2),可以建立改进的topsis模型,,改进的topsis不需要直接赋权。
6 G+ i6 F6 I) f第三问0 J1 x0 Y$ L0 w0 N) M
        本问要求分析葡萄和葡萄酒的理化指标之间的关系。很只管的想法是及西宁回归分析,但是貌似拟合结果非常差,他们的相关系数矩阵也惨不忍睹,基于这种情况,可以考虑如下两种方法:
& S; W+ q5 s. F  b6 T: J    (1)从化学的角度,分析出在葡萄理化指标中,与葡萄酒理化指标分别相关的指标,再进行拟合。方法貌似还可以,但是拟合不好说,因为线性拟合效果肯定是不好的,只有考虑非线性拟合,这时的非线性拟合可不会是二次、三次,很可能是向指数、对数等的拟合。
6 a+ C" H4 D  g* |% c  m- k    (2)建立中间变量,如下图所示,从而将多维指标建模转化为单维指标建模,然后进行拟合。利用第二问的topsis排序法进行多维指标到单维指标转化的方法,最后对两者建模,效果还是可以的,这里就不细说了。# _& \! t  [/ E, p2 w! g. m7 K

) s: l  n8 v" ^ 中间变量.jpg
# \! s* c5 y- ~' T# I# l  d' g第四问
0 G2 D& y3 P. c! z/ C2 l$ k$ d! Y        本问也分为两个小问,前半部分和后半部分是相互制约的。第三问做出来了,第四问的前半部分不言而喻,肯定是有关系的,而且可以建立起关系。9 z9 g) W9 X3 j8 z# H. k( }$ z5 M
         那么好,问题的关键来了,附件3芳香物质的梨花指标是用来做什么的?这可让很多同学感到茫然,虽然数学中国有一些答疑,但是很多同学进不去,我也进不去,我也是通过自己的分析猜测出来的。见下图
( b" u4 l0 O1 B2 |( X) w$ x6 ` 方向.jpg * h/ E! O7 V$ T) f$ R2 l0 Q
         通俗的讲,评价要综合理性评价(基于理化指标)和感性评级(通过外在感受),在问题3和问题4的前半部分,实际上纯粹是通过理性评价得出来的结果,但是葡萄酒最终是给人品尝的,在实用性角度上,感性评价甚至更重要,芳香物质就是影响感性评价的主要因素,因为芳香物质是用来验证的。' K* i! l& X" ?* [( D  s! e6 b4 g' `. A
具体而言,基于问题4的前半部分可以得到一个葡萄酒的评价,再利用芳香物质进行建模得到葡萄酒的另一个评价,两种评价方案是否具有一致性是论证的关键。
; Z" x7 Q- H$ m" j% J8 i2 s        在这里又产生了2个问题:(1)如何利用芳香物质建模;(2)一致性的定义。这也是值得推敲和琢磨的地方。5 q2 C+ s& A0 @! E6 \& w
        个人意见,仅供参考,也欢迎大家相互讨论!

作者: 安树庭    时间: 2012-9-11 10:29
人道主义挽回楼主尊严,消灭零回复
作者: 920504lzl    时间: 2012-9-11 13:21
楼主威武!!!
作者: 逆风细雨    时间: 2012-9-11 13:33
给你回复一个。。。。写的不错,估计今年是帮别人做来。。。要不不会这么详细
作者: alas123    时间: 2012-9-11 13:36
第三问用多元线性性回归分析,多变量对多变量线性回归分析,建立模型效果也不错拟合优化度可以到到0.9以上
作者: darker50    时间: 2012-9-11 13:42
  最后一问的想法和我当时的想法一样,不过没有具体去研究怎么做,嘿嘿。
作者: 175205100    时间: 2012-9-11 13:43
有理可依。。。
作者: ◇◆、右手边    时间: 2012-9-11 14:40
和我做的差不多。。。只是我们的文章最后不够清晰
作者: liqiongqii    时间: 2012-9-11 14:47
问题分析得很透彻 ,看了这个,如果论文中的问题分析 写成这样。我想我下次该怎么写问题分析了。谢谢。
作者: 1135934876    时间: 2012-9-11 16:40
有道理,有些地方和我们的思路很相似,但有些地方思路不同!
作者: 安树庭    时间: 2012-9-11 16:55
逆风细雨 发表于 2012-9-11 13:33
8 k' B6 z3 O. E6 n! f8 r; s给你回复一个。。。。写的不错,估计今年是帮别人做来。。。要不不会这么详细
4 h; {2 S+ ^% f2 x$ M
不是的  呵呵  报名参加了研究生数模竞赛   看到题目  感觉很有搞头,作为研究生数模的一次练兵
作者: 下一个,天亮    时间: 2012-9-11 19:12
基本和我们思路差不多,感觉大家都是这么做的吧。
作者: qiuzhichang    时间: 2012-9-11 20:22
前面差不多 后面有想到 但是最后不会啊  不会实现。。。。。。。
作者: 远行的人    时间: 2012-9-11 20:37
写的很好,赞一个
作者: hitzhaowenqiang    时间: 2012-9-11 20:52
楼主第四问高见
作者: 七月里的七月    时间: 2012-9-11 21:38
alas123 发表于 2012-9-11 13:36
& }& @, O) X8 C9 i第三问用多元线性性回归分析,多变量对多变量线性回归分析,建立模型效果也不错拟合优化度可以到到0.9以上

, u+ {* v. l/ s; C你变量太多了  拟合得效果自然好  
作者: river725    时间: 2012-9-11 22:05
牛人,貌似跟我们做的差不多啊,就是我们论文没写好
作者: 再擦啸月的老    时间: 2012-9-11 22:07
分析有个鸟用,TMD数据处理搞死你,很多的方法都JB的实现不了,或者效果很差。
作者: 安树庭    时间: 2012-9-11 22:12
七月里的七月 发表于 2012-9-11 21:38
+ H# k- I* u( e0 h0 s4 H你变量太多了  拟合得效果自然好
, j) R! m, f! r+ I4 n% w3 @
貌似没有必然关系
作者: alas123    时间: 2012-9-11 22:52
七月里的七月 发表于 2012-9-11 21:38
) ~0 r) g5 i8 T  ]& z0 a2 {你变量太多了  拟合得效果自然好
1 j, ]1 e6 H  q2 N! K$ R
第二个问用主成分分析,踢除了最后剩下12个变量,能够代表0.91的数据。所以变量也不是太多,最后也就20来个
作者: hasen_chen    时间: 2012-9-11 23:07
那么不知道LZ对于第三问,使用神经网络有什么看法呢?
作者: dabiu    时间: 2012-9-12 07:46
有些地方和我们思路一样,有些不同
作者: sdccumcm    时间: 2012-9-12 11:23
直接猛!   
作者: 安树庭    时间: 2012-9-12 12:53
再擦啸月的老 发表于 2012-9-11 22:07 ! A6 Q4 d7 Y0 l& k' j
分析有个鸟用,TMD数据处理搞死你,很多的方法都JB的实现不了,或者效果很差。
( v  T% r( M. [# d- o2 u1 S
如果没有处理过 我怎么敢说那个方法你和效果好呢?
作者: 安树庭    时间: 2012-9-12 12:55
hasen_chen 发表于 2012-9-11 23:07 " W6 Q/ h. Y2 `! s; v
那么不知道LZ对于第三问,使用神经网络有什么看法呢?

9 p5 p  p6 t+ ^/ ?) A2 d. h我不是很懂神经网络的方法  但是也听说有些人用这个  我一直觉得对于这个题目,不管你用什么方法的得出来结论,难得就是解释你的结论    解释很难
作者: sdccumcm    时间: 2012-9-12 13:18
安树庭 发表于 2012-9-11 10:29
$ n# G, |7 b3 M: c人道主义挽回楼主尊严,消灭零回复
& d. M3 ?' n. Z; K6 b5 X
支持         
作者: xywh0    时间: 2012-9-12 13:31
嗯,顶一个。
作者: 七月里的七月    时间: 2012-9-12 14:00
安树庭 发表于 2012-9-11 22:12 ! N( i- H; b' `6 d4 H
貌似没有必然关系
6 L; V* T  |' t2 j1 U# h
变量多会多重共线
作者: 清风隽逸    时间: 2012-9-12 14:30
嗯,不错不错不错不错
作者: 安树庭    时间: 2012-9-12 15:46
七月里的七月 发表于 2012-9-12 14:00
, d* o0 q+ O8 S& G. z7 O. U' P9 l变量多会多重共线
% g2 B! ~% V# ]
  又学到知识了    不过我再做的时候发现你和效果蛮差呢  不知道什么原因引起来的 (我是降维之后)
作者: 子均    时间: 2012-9-12 16:25
不做评论。。。
作者: 再擦啸月的老    时间: 2012-9-12 18:16
安树庭 发表于 2012-9-12 12:55 7 ]1 s9 W8 |3 n, H. t% c
我不是很懂神经网络的方法  但是也听说有些人用这个  我一直觉得对于这个题目,不管你用什么方法的得出来 ...
1 K& ]8 T1 k! F5 ?! o% a1 P# s/ {
可以用SOM神经网络,不过分类效果太差了。
作者: 39133120    时间: 2012-9-12 18:27
分析有道理!
作者: pxl090712    时间: 2012-9-12 19:25
不能分享么
作者: njmathmath    时间: 2012-9-12 20:35
shia 感觉很多表述不清
作者: njmathmath    时间: 2012-9-12 20:38
shia 感觉很多表述不清
作者: cyg0810    时间: 2012-9-12 20:41
写的很详细。不错
作者: hbdkfk2    时间: 2012-9-12 22:15
厉害 !!!!!!!!!
作者: cui_e    时间: 2012-9-12 23:51
神经网络的飘过
作者: hasen_chen    时间: 2012-9-15 13:26
安树庭 发表于 2012-9-12 12:55
) X1 L' R* Y9 F% N# @7 X我不是很懂神经网络的方法  但是也听说有些人用这个  我一直觉得对于这个题目,不管你用什么方法的得出来 ...

! o. Z$ C& j) q/ y: T! x6 b5 }9 e的确,这次用神经网络不知道怎么表述,就是一种训练成功的网络就是一种映射关系,这种不能用具体表达式说明,只能说参数说参数,说参数,感觉到要是改卷老师对这种不理解,那就……………………祈求保佑了
作者: 快乐海滨2011    时间: 2012-9-15 13:31
很不错,,谢谢分享。。。
作者: 天使死神    时间: 2012-9-15 23:14
这要是当时能有该多好啊,有点出入啊
作者: love6343777    时间: 2013-1-29 19:48
好想法,跟我们做的方法不一样,不过值得借鉴,顶一个
作者: mechatronics    时间: 2013-4-22 17:05
分析的不错呵
作者: cdjznsb    时间: 2013-4-23 17:24
分析的挺有建模的味道
作者: 他山石    时间: 2013-7-25 09:38
收益匪浅啊。
作者: 菜菜菜    时间: 2013-7-29 09:47
写作颇有外国论文的风范啊
作者: hzauwkx01    时间: 2013-8-9 10:15
顶起!!!
作者: 命脉♂←左邊ら.    时间: 2013-8-15 16:59
好东西  赞
作者: 13594767563    时间: 2013-8-17 08:10
大体上是这样的
作者: 涂卡铅笔    时间: 2013-8-17 09:08
看了给个回复,哈哈
作者: 沁路墨彦    时间: 2013-8-17 09:43
分析的很不错,赞一个!
作者: Leelivable    时间: 2013-8-19 16:59
很受用!!!
作者: 飞翔的    时间: 2013-8-20 01:15
你可以
作者: 知时节008    时间: 2013-8-23 10:11
好棒
作者: 抱一    时间: 2014-9-11 13:05
分析的很头沉




欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5