QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4165|回复: 3
打印 上一主题 下一主题

[建模教程] SAS相关性分析(附带实例解析,特别有用)

[复制链接]
字体大小: 正常 放大

453

主题

24

听众

4332

积分

  • TA的每日心情
    奋斗
    2016-9-9 07:08
  • 签到天数: 157 天

    [LV.7]常住居民III

    国际赛参赛者

    自我介绍
    建模爱好者

    社区QQ达人 新人进步奖 发帖功臣

    群组2015SAS数据分析大赛

    群组西京学院数学建模协会

    跳转到指定楼层
    1#
    发表于 2015-10-5 19:16 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    SAS相关性分析
    5 a8 Y; M& K; q

    在统计上,x和y变数的关系有两种理论模型,第一种是回归模型;第二种叫相关模型或双变数正态总体模型。回归模型除具有自变数和依变数的区别外,还具有预测的特征,即具有由x的数量变化预测y的数量变化。相关关系是指在一定范围内,一个变数的任一变量(如xi),虽然没有另一个变数的一个确定数值yi与之对应,但是却有一个特定的yi的条件概率分布与之对应,只要这种关系存在,我们就定义变数y和x有相关关系。相关模型中,没有自变数和依变数的区别,不具有预测特性,它仅表示两个变数的偕同变异。5 B( b; n; S7 _. t9 ?
        回归模型资料的统计方法叫回归分析,这一分析方法是要导出由x来预测或控制Y的回归方程,并确定当给自变数x为某一值时依变数y将会在什么范围内变化。相关模型资料的统计方法叫相关分析,这一分析是要测定两个变数在数量关系上的密切程度和性质。SAS系统的CORR过程能够计算两个变量间的相关系数,包括Pearson,Spearman,Hoeffding, Kendall等相关系数及其他一些统计量。' H3 @9 d0 h& U' H" {

    : `2 w6 i! C; i; M' o& iCORR过程格式

    • PROC CORR;
    • VAR 变量表;
    • WITH 变量表;
    • PARTIAL 变量表;
    • WEIGHT 变量;
    • FREQ 变量;
    • BY 变量表;2 A( |( l4 M7 n4 f+ N
    * t+ W" N& D3 b  m+ b$ w- _
    复制代码

    4 G( e3 ^" t$ i) V3 g, sCORR过程语句说明
    7 J1 a. Z( J- P1 W  B; z5 C一、PROC CORR语句选择项
    4 S* f( i' J8 B3 w/ {DATA=数据集 指明需处理的数据集名,缺省时为当前数据集。: N; f3 t! E6 P
    OUTP=数据集 要求产生一个含有Pearson相关的一个新数据集。
    ( K5 Y+ x5 ?( P' d7 }7 OOUTS=数据集 要求产生一个含有Spearman相关的一个新数据集。
    ' ?; g  @" }/ D6 v5 O9 DOUTK=数据集 要求产生一个含有Kendall相关的一个新数据集。/ _0 U5 X. c, Y: P& p# R
    OUTH=数据集 要求产生一个含有Hoeffding相关的一个新数据集。
    % n/ d  s* F3 G& Q6 ?' r6 qPEARSON 计算通常的Pearson积矩相关,是缺省值。4 g6 X# ]- m. C/ d5 @
    SPEARMAN 计算Spearman等级相关系数3 K- N8 f4 N. M' ]" x. B6 J
    KENDALL 计算Kendallτ-b系数。* p7 R  @8 s: h& {! [
    HOEFFDING 计算Hoeffding D统计量。
    ; w3 u5 f. T- P% D' tNOMISS 将带有某一变量缺失值的观察值从所有计算中除去。
    ' _9 u6 g- s1 b6 M# _VARDEF=DF|WGT|N|WDF 指定计算方差和协方差的分母。N观察值个数,DF自由度,WGT权重合,WDF权重合减1。
      M2 Q  o" e' h, ?" W& s4 N# }! _NOSIMPLE 抑制简单统计。
    5 s* n0 t6 I' ^2 b1 c' eBEST=n 只输出每个变量与其他变量间最高的n个相关系数。2 F, O' s- m* |; c
    NOPRINT 抑制任何报表的输出。$ |+ B. L" S: M; e% t8 k
    NOCORR 在输出数据集中不包括相关系数。$ m5 T( F8 B' w- g" P3 A+ b  J9 W
    NOPROB 不输出相关系数的显著性测验。8 F3 V" V$ V1 c, Q  H
    RANK 将每一变量与其他变量的相关系数按由大到小的顺序排列。. s$ T( B. e. m- o9 y; o4 f  x" [; N
    二、VAR语句
    . C) X' Q" A3 _; }9 J- HVAR 变量表6 ]2 q" m' Y* {
    指明要计算相关分析的变量名,缺省时,计算所有数值型变量间相关系数。7 Y8 d2 }. T2 ]& ?! r) Z% q
    三、WITH语句
    ! \& {. g/ k! UWITH变量表 指明特别配对的变量名,与VAR语句配对使用,VAR语句列出相关矩阵上部出现的变量,WITH语句列出左侧出现的变量。0 u  X6 {4 v& P# k2 ]
    四、PARTIAL语句' g) G6 e, L' I6 P: s2 |/ |6 k
    PARTIAL变量表 指明求偏相关时的偏变量名,同时激活NOMISS选择项。
    1 ]" x& h$ R. d. E! P# O  b
    ) B- R  |2 ]# f% E应用实例( d0 `  [5 n9 d8 g
    例1 一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进县测定1956~1964年3月下旬至4月中旬旬平均温度累积值(x,单位:旬.度)和一代三化螟蛾盛发期(y,以5月10日为0)的数据见表1,试计算x和y的相关系数和决定系数。0 ]) ~# {. |) Y1 l, r6 ~" F- u, Q( p
    表1 累积温和一代三化螟蛾盛发期的关系数据
    ( a4 U. K' L$ [3 |, F( YX累积温        35.5        34.1        31.7        40.3        36.8       40.2        31.7        39.2        44.2
    4 M# I( [4 k7 d3 \% aY盛发期        12        16        9        2        7        3       13        9        -1) F+ V& u% ?8 S9 w& U( l, b. y/ x
           程序及说明
    •    DATA new;
    •     INPUT x y@@;
    •   CARDS;
    •      35.5 12 34.1 16 31.7 9 40.3 2 36.8 7 40.2 3 31.7 13 39.2 9 44.2 -1
    • PROC CORR;
    •   VAR x y;
    • RUN;
      % E. R. C: G$ J
    % v4 f: W9 T+ Z% [3 G0 j2 m

    ●        输出结果及说明
    - `/ w# U* Z+ y$ u  S3 K7 z                                 Correlation Analysis相关分析
    ( e. o- M1 m4 Y: x                          2 'VAR' Variables:  X        Y      3 ^, d2 Z( @0 y( s7 ^/ W( u  F
             Simple Statistics, Z) i0 e% C6 m- Y9 V4 n
    简单统计
    - C* w7 A5 Y/ L+ }% H1 I: k% x) }Variable      N         Mean      Std Dev          Sum      Minimum     Maximum; M. I: e5 P- N3 Y5 G7 G( z9 Q$ Q% `
    变量名      观察值个数 平均数    标准差          总和      最小数        最大数
    , q! q/ J1 a. `% G7 UX            9     37.07778      4.25199    333.70000     31.70000     44.20000
    - W9 {; K4 j" H3 j6 OY            9      7.77778      5.58520     70.00000     -1.00000     16.00000% n- [( f- f9 k* L2 J

    7 p8 f" [6 D% P6 j9 b       Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0 / N = 9  
    - _) q3 @; a' v8 T' M      PEARSON相关系数% d, r- e3 k6 D: n- v# E
                                              X                 Y
    7 u) a  r; F/ i/ o( L/ X/ U# c0 K                        X           1.00000          -0.83714
    + ]! k2 \4 I$ g3 `' w3 F                                    0.0               0.0049; O' x4 F5 a' c+ g
                            Y          -0.83714           1.00000
    , v$ D7 W4 j( g/ `, [# T/ [6 y$ U                                    0.0049            0.0   
    0 I. V2 n: A0 `9 E$ Q! s可见,x与y相关系数为-0.83714,概率为0.0049,达到极显著水平。
    $ H6 y5 I" G8 Z: l- k& O$ `6 E0 O例2 测定13块中籼南京11号高产田的每亩穗数(x1,单位:万)、每穗粒数(x2)和每亩稻谷产量(y,单位:斤),得结果如表2。试分析每亩穗数、每穗粒数和亩产量间的相关。9 }1 x" r9 j6 E- i
    表2 每亩穗数(x1)、每穗粒数(x2)与亩产量(y)
    ( U- }7 A" x  m/ v) v" Fx1        x2        Y        x1        x2        Y        x1       x2        Y
    & x+ v. g! H! |26.7        73.4        1008        33.8        64.6        1103       31.5        61.1        1004
    , s( ?- g; B2 ~# O+ H31.3        59.0        959        30.4        62.1        992       33.1        56.0        995
    ! {5 e& r& T$ _% R7 V& Z# c30.4        65.9        1051        27.0        71.4        945       34.0        59.8        1045
    1 B9 k8 `6 d/ C8 |33.9        58.2        1022        33.3        64.5        1074                     
    # M: O& {1 d5 i& Z# q5 ]34.6        64.6        1097        30.4        64.1        1029                      5 c  Z1 v% h) A. F
    ●        程序及说明

    •    DATA new;
    •    INPUT x1 x2 y;
    •    Cards;
    •       26.7    73.4    1008
    •       31.3    59.0    959
    •       30.4    65.9    1051
    •       33.9    58.2    1022
    •       34.6    64.6    1097
    •       33.8    64.6    1103
    •       30.4    62.1    992
    •       27.0    71.4    945
    •       33.3    64.5    1074
    •       30.4    64.1    1029
    •       31.5    61.1    1004
    •       33.1    56.0    995
    •       34.0    59.8    1045
    • PROC CORR NOSIMPLE;
    •   VAR x1 x2 y;
    • RUN;
      - h( z0 ^+ y. [- O- V4 D1 E

    # B1 Z8 G. G4 N/ }4 |' I! l9 _
    - a6 g, B/ c- V
           输出结果及说明
    # j. _1 c. C7 p1 H+ c4 D; u                                 Correlation Analysis6 ?  }1 U# N$ [! ?+ S6 a7 A
                         3 'VAR' Variables: X1       X2       Y      . c: T  x+ w3 d5 d! j" w
          Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0 / N = 13   z% h) u" O1 F! y
                                    X1                X2             Y* e% j  d  [0 E2 I% F
                  X1          1.00000          -0.71738          0.62939
    7 t1 W3 W! e: y' z                            0.0               0.0058            0.0212
    5 k1 k- e5 \% H* F0 n               X2          -0.71738          1.00000          0.01347" k  O& e! {$ P# Q/ R1 _1 E' H- J- y
                               0.0058            0.0               0.9652  y; h# E8 i4 g" X% ?. w& \+ T
                  Y            0.62939          0.01347          1.00000
    : ^' z1 a9 `- P) }) \/ ~$ b7 l                            0.0212            0.9652          0.0   1 g$ c2 `8 E- b9 Y) ^2 l
    由相关分析可知,x1和x2间的相关系数为-0.71738,达极显著水平(P=0.0058<0.01);x1和y的相关系数为0.62939,达显著水平(P=0.0212<0.05);x2和y的相关系数为0.01347,未达到显著水平(P=0.9652>0.05)。
    9 `' `# W6 y7 [# @
    ) ?1 g+ v. l3 \' w
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    樂淘淘        

    2

    主题

    12

    听众

    4

    积分

    升级  80%

    该用户从未签到

    自我介绍
    AAO
    回复

    使用道具 举报

    废材        

    5

    主题

    15

    听众

    420

    积分

    升级  40%

  • TA的每日心情
    慵懒
    2019-9-21 12:34
  • 签到天数: 177 天

    [LV.7]常住居民III

    网络挑战赛参赛者

    自我介绍
    数学建模新手

    邮箱绑定达人 社区QQ达人

    群组2017美赛备战交流群组

    群组2016国赛备战群组

    回复

    使用道具 举报

    废材        

    5

    主题

    15

    听众

    420

    积分

    升级  40%

  • TA的每日心情
    慵懒
    2019-9-21 12:34
  • 签到天数: 177 天

    [LV.7]常住居民III

    网络挑战赛参赛者

    自我介绍
    数学建模新手

    邮箱绑定达人 社区QQ达人

    群组2017美赛备战交流群组

    群组2016国赛备战群组

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-14 23:49 , Processed in 0.483280 second(s), 71 queries .

    回顶部