QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2303|回复: 0
打印 上一主题 下一主题

[建模教程] 主成分分析法(二):计算步骤

[复制链接]
字体大小: 正常 放大
浅夏110 实名认证       

542

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2020-11-14 17:15
  • 签到天数: 74 天

    [LV.6]常住居民II

    邮箱绑定达人

    群组2019美赛冲刺课程

    群组站长地区赛培训

    群组2019考研数学 桃子老师

    群组2018教师培训(呼伦贝

    群组2019考研数学 站长系列

    跳转到指定楼层
    1#
    发表于 2020-6-8 15:26 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta |邮箱已经成功绑定
    一:主成分分析简述; }! @2 {2 t7 M. x6 B) Z
    主成分分析是多元统计分析中重要的降维与分析评价方法;多元分析(multivariate analyses)是多变量的统计分析方法,是数理统计中应用广泛的一个重要分支。由于变量的相关性,不能简单地把每个变量的结果进行汇总,这是多变量统计分析的基本出发点。
    9 U) z% d# v5 V5 q( {
    - w* d  `. G3 ]7 j# W( ~主成分分析(principal component analysis)是1901年Pearson对非随机变量引 入的,1933年Hotelling将此方法推广到随机向量的情形,主成分分析和聚类分析有很 大的不同,它有严格的数学理论作基础。  
    ' \3 f0 C! d  u$ f, Q# D: ?0 J& \8 M- ]. L- A( F8 G
    主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我 们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始 变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资 料的综合性指标。由此可见,主成分分析实际上是一种降维方法。 主成分分析试图在力保数据信息丢失少的原则下,对多变量的截面数据表进行最佳综合简化,即对高维变量空间进行降维处理。, Q; p- u7 b! `" b

    : E7 {: F8 ^# X7 D! F二:主成分分析法的步骤
    " v2 W9 n! ]2 {1)对原始数据进行标准化处理 ' Y* m  b5 c8 I' p7 P9 _  ^

    . F+ ^5 w+ z1 q+ F6 ^
    6 y' S9 Y$ d$ v% ], ^           其中 , 即分别为第j个指标的样本均值和标准差。
    7 H/ K7 u/ W% r# m' i+ f
    / A7 ?# a+ t7 }- p% r
    ; q5 ?) x( p, g8 D6 I" r- O
    ; P7 Y9 n, u! m. I2)计算相关系数矩阵R
    ' g" E! g& b+ s, F! E* y( C% S1 m) P6 D! h8 t+ F/ o
    / w" Z! j1 |7 r. B
    $ M2 _5 ]5 g/ I, S
    3)计算特征值和特征向量 2 Q& s$ p; L( W8 m7 G
       特征值要由大到小排序' E/ I: E1 e6 X# z6 d! ^

      Q7 \  D* M" q+ T% _% A, U
    ; T+ b- k2 P4 I' F& _
    5 F& U" C0 H1 h3 L) `, N4)选择 p ( p ≤ m )个主成分,计算综合评价值
    * H; F( H% n2 m5 ~8 I  C
    5 o5 k* I5 ?1 B2 c8 y
    # Y2 i, L& d2 E& O7 ]5 H
    7 V) t5 Z  d7 P8 r# ]h+ b' L' N% m7 `* h
    5 l' y( k8 O1 h3 J
    matlab实现主成分分析的pcacov( )函数  ?# m1 y0 r; d' a5 y' L

    . }9 Q$ N5 b, P3 D+ jclc,clear
    / [$ H) v! F0 _1 Y4 Oload gj.txt   %把原始数据保存在纯文本文件gj.txt中 % _+ ]2 X4 a* N: ^1 v
    gj=zscore(gj); %数据标准化 / C+ f/ h4 {! J, X
    r=corrcoef(gj);  %计算相关系数矩阵 ' G" y% ~  ~" _# a  A; {9 R( l
    [x,y,z]=pcacov(r);   I& P0 a: O6 d4 I
    f=repmat(sign(sum(x)),size(x,1),1);
    % c. N9 }6 W9 m% H' dx=x.*f; 0 N5 m, X7 x5 f2 n- R, O
    df=gj*x(:,1:4) ( Y0 B1 ]- n! X- h( V
    tf=df*z(1:4)/100; / X& I; Y: k  d4 q: B  q4 b
    [stf,ind]=sort(tf,'descend') / r$ D# X+ z1 P3 y% X$ X/ h

    3 ^7 `- h3 U9 x) J7 o8 i4 ]( e0 t7 v$ \% @5 Z: \
    ————————————————& D7 L6 c2 }: j9 n3 I2 j
    版权声明:本文为CSDN博主「wamg潇潇」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。% y$ t3 L( P# J
    原文链接:https://blog.csdn.net/qq_29831163/article/details/88900766/ [; w1 l+ ?0 [% V7 ?3 r$ Y
    0 X' q2 e/ B+ q4 g

    2 L& m1 q) I; f( N
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-13 03:30 , Processed in 1.126365 second(s), 50 queries .

    回顶部