QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1734|回复: 0
打印 上一主题 下一主题

数学建模之主成分分析方法 

[复制链接]
字体大小: 正常 放大

100

主题

17

听众

7535

积分

升级  50.7%

  • TA的每日心情
    开心
    2018-6-4 15:01
  • 签到天数: 7 天

    [LV.3]偶尔看看II

    群组2018年大象老师国赛优

    群组高考备战

    群组2018中小学数学建模冬

    跳转到指定楼层
    1#
    发表于 2018-10-29 10:27 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
            数学建模之主成分分析方法
    地理环境是多要素的复杂系统,在我们进行地理系统分析时,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,我们就会很自然地想到,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息?事实上,这种想法是可以实现的,这里介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。 一、主成分分析的基本原理 
    主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的地理数据矩阵:
    如何从这么多变量的数据中抓住地理事物的内在规律性呢?要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。 
    如果记原来的变量指标为x1x2,…,xp,它们的综合指标——新变量指标为z1z2,…,zmmp)。则
    在(2)式中,系数lij由下列原则来决定: 
    1)zizjijij=12,…,m)相互无关; 
    2)z1x1x2,…,xp的一切线性组合中方差最大者;z2是与z1不相关的x1x2,…,xp的所有线性组合中方差最大者;……;zm是与z1z2,……zm-1都不相关的x1x2,…,xp的所有线性组合中方差最大者。 
    这样决定的新变量指标z1z2,…,zm分别称为原变量指标x1x2,…,xp的第一,第二,…,第m主成分。其中,z1在总方差中占的比例最大,z2z3,…,zm的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。 从以上分析可以看出,找主成分就是确定原来变量xjj=12,…,p)在诸主成分zii=12,…,m)上的载荷liji=12,…,mj=12,…,p),从数学上容易知道,它们分别是x1x2,…,xp的相关矩阵的m个较大的特征值所对应的特征向量。 二、主成分分析的计算步骤 
    通过上述主成分分析的基本原理的介绍,我们可以把主成分分析计算步骤归纳如下:
    1)计算相关系数矩阵
    在公式(3)中,rijij=12,…,p)为原来变量xixj的相关系数,其计算公式为
    因为R是实对称矩阵(即rij=rji),所以只需计算其上三角元素或下三角元素即可。 (2)计算特征值与特征向量 
    首先解特征方程|λI-R=0求出特征值λii=1
    2,…,p),并使其按大小顺序排列,即λ1≥λ2≥…,≥λp0;然后分别求出对应于特征值λi的特征向量eii=12,…,p)。 
    2) 计算主成分贡献率及累计贡献率
    5.PNG
    一般取累计贡献率达85-95%的特征值λ1,λ2,…,λ
    m所对应的第一,第二,……,第mmp)个主成分。 
    (3)  计算主成分载荷
    6.PNG
    三、主成分分析实例
    对于某区域地貌-水文系统,其57个流域盆地的九项地理要素:x1为流域盆地总高度(m)x2为流域盆地山口的海拔高度(m)x3为流域盆地周长(m)x4为河道总长度(km)x5为河 表2-14  某57个流域盆地地理要素数据
    7.PNG
    8.PNG
    道总数,x6为平均分叉率,x7为河谷最大坡度(度)x8为河源数及x9为流域盆地面积(km2)的原始数据如表2-14所示。张超先生(1984)曾用这些地理要素的原始数据对该区域地貌-水文系统作了主成分分析。下面,我们将其作为主成分分析方法的一个应用实例进行介绍。 表2-15相关系数矩阵
    9.PNG
    (1) 首先将表2-14中的原始数据作标准化处理,由公式(4)计算得相关系数矩阵(见表2-15)。(2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表2-16)。由表2-16可知,第一,第二,第三主成分的累计贡献率已高达86.5%,故只需求出第一,第二,第三主成分z1z2z3即可。 表2-16  特征值及主成分贡献率
    10.PNG
    3)对于特征值λ1=5.043,λ2=1.746,λ3=0.997分别求出其特征向量e1e2e3,并计算各变量x1x2,……,x9在各主成分上的载荷得到主成分载荷矩阵(见表2-17)。 表2-17  主成分载荷矩阵
    11.PNG
    从表2-17可以看出,第一主成分z1x1x3x4x5x8x9有较大的正相关,这是由于这六个地理要素与流域盆地的规模有关,因此第一主成分可以被认为是流域盆地规模的代表:第二主成分z2x2有较大的正相关,与x7有较大的负相关,而这两个地理要素是与流域切割程度有关的,因此第二主成分可以被认为是流域侵蚀状况的代表;第三主成分z3x6有较大的正相关,而地理要素x6是流域比较独立的特性——河系形态的表征,因此,第三主成成可以被认为是代表河系形态的主成分。 
    以上分析结果表明,根据主成分载荷,该区域地貌-水文系统的九项地理要素可以被归为三类,即流域盆地的规模,流域侵蚀状况和流域河系形态。如果选取其中相关系数绝对值最大者作为代表,则流域面积,流域盆地出口的海拔高度和分叉率可作为这三类地理要素的代表,利用这三个要素代替原来九个要素进行区域地貌-水文系统分析,可以使问题大大地简化

    0 J6 J) w, t  Y, R

    1.PNG (6.79 KB, 下载次数: 367)

    1.PNG

    2.PNG (12.62 KB, 下载次数: 350)

    2.PNG

    3.PNG (6.76 KB, 下载次数: 343)

    3.PNG

    4.PNG (11.09 KB, 下载次数: 318)

    4.PNG

    5.PNG (8.61 KB, 下载次数: 308)

    5.PNG

    6.PNG (19.15 KB, 下载次数: 329)

    6.PNG

    7.PNG (155.63 KB, 下载次数: 350)

    7.PNG

    8.PNG (168.57 KB, 下载次数: 328)

    8.PNG

    9.PNG (38.84 KB, 下载次数: 348)

    9.PNG

    10.PNG (46.37 KB, 下载次数: 321)

    10.PNG

    11.PNG (43.05 KB, 下载次数: 344)

    11.PNG

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-15 06:32 , Processed in 0.475824 second(s), 53 queries .

    回顶部