QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4221|回复: 3
打印 上一主题 下一主题

[建模教程] SAS相关性分析(附带实例解析,特别有用)

[复制链接]
字体大小: 正常 放大

453

主题

24

听众

4332

积分

  • TA的每日心情
    奋斗
    2016-9-9 07:08
  • 签到天数: 157 天

    [LV.7]常住居民III

    国际赛参赛者

    自我介绍
    建模爱好者

    社区QQ达人 新人进步奖 发帖功臣

    群组2015SAS数据分析大赛

    群组西京学院数学建模协会

    跳转到指定楼层
    1#
    发表于 2015-10-5 19:16 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    SAS相关性分析4 \$ c' M0 f' |

    在统计上,x和y变数的关系有两种理论模型,第一种是回归模型;第二种叫相关模型或双变数正态总体模型。回归模型除具有自变数和依变数的区别外,还具有预测的特征,即具有由x的数量变化预测y的数量变化。相关关系是指在一定范围内,一个变数的任一变量(如xi),虽然没有另一个变数的一个确定数值yi与之对应,但是却有一个特定的yi的条件概率分布与之对应,只要这种关系存在,我们就定义变数y和x有相关关系。相关模型中,没有自变数和依变数的区别,不具有预测特性,它仅表示两个变数的偕同变异。
    ! G5 D% k3 U' N) W0 F    回归模型资料的统计方法叫回归分析,这一分析方法是要导出由x来预测或控制Y的回归方程,并确定当给自变数x为某一值时依变数y将会在什么范围内变化。相关模型资料的统计方法叫相关分析,这一分析是要测定两个变数在数量关系上的密切程度和性质。SAS系统的CORR过程能够计算两个变量间的相关系数,包括Pearson,Spearman,Hoeffding, Kendall等相关系数及其他一些统计量。
    2 u  |4 P1 I6 R) ]( J! {# B. c! {5 A" j
    CORR过程格式

    • PROC CORR;
    • VAR 变量表;
    • WITH 变量表;
    • PARTIAL 变量表;
    • WEIGHT 变量;
    • FREQ 变量;
    • BY 变量表;: S( |4 O- Q& j6 Z, H2 K
    6 S; V  K9 B5 P) _. A
    复制代码

    # J  v5 p( {: t% @* y+ OCORR过程语句说明, C" ~. m4 K  }  g/ Y9 c; [) |$ J
    一、PROC CORR语句选择项
    " d7 Y' a& z3 }9 ]& [DATA=数据集 指明需处理的数据集名,缺省时为当前数据集。  S' o0 X& ]3 r  |% J
    OUTP=数据集 要求产生一个含有Pearson相关的一个新数据集。( o5 B! D: ]  T. g
    OUTS=数据集 要求产生一个含有Spearman相关的一个新数据集。
    ! Z: ]7 v3 \5 K# L+ o8 P2 K) @OUTK=数据集 要求产生一个含有Kendall相关的一个新数据集。5 i/ J* u7 c' h  E+ |
    OUTH=数据集 要求产生一个含有Hoeffding相关的一个新数据集。' o4 W3 k) r* b. f
    PEARSON 计算通常的Pearson积矩相关,是缺省值。
    1 r3 r" C4 v; h. C6 xSPEARMAN 计算Spearman等级相关系数
    - t' N$ C+ V9 l0 w0 e# XKENDALL 计算Kendallτ-b系数。0 U/ N- c- G6 F! b: G" V3 j. D! W
    HOEFFDING 计算Hoeffding D统计量。
    2 m8 I6 @9 i5 Z" c& }NOMISS 将带有某一变量缺失值的观察值从所有计算中除去。
    1 @) T- O0 ~' }+ Q" T, HVARDEF=DF|WGT|N|WDF 指定计算方差和协方差的分母。N观察值个数,DF自由度,WGT权重合,WDF权重合减1。
    2 m) ?" Q. m  s7 D" DNOSIMPLE 抑制简单统计。
    ; Y& T: ^9 c9 m4 Z5 UBEST=n 只输出每个变量与其他变量间最高的n个相关系数。
    . Q/ N  l- D5 i. ONOPRINT 抑制任何报表的输出。8 Z% K. U8 e: w! s  h& o3 ?
    NOCORR 在输出数据集中不包括相关系数。3 F! S9 K! ]: h$ \! k( m3 c% c
    NOPROB 不输出相关系数的显著性测验。
    / H' m. M8 Q: ^( zRANK 将每一变量与其他变量的相关系数按由大到小的顺序排列。0 _$ P& D3 k) V% R8 C
    二、VAR语句
    4 p% U( h* ^1 @4 B/ p; rVAR 变量表
    ( y2 G- a# j6 b- |8 b指明要计算相关分析的变量名,缺省时,计算所有数值型变量间相关系数。$ k4 A6 s$ Y2 d& a; [
    三、WITH语句2 j; k0 |1 t  O7 A2 N/ R# I/ i
    WITH变量表 指明特别配对的变量名,与VAR语句配对使用,VAR语句列出相关矩阵上部出现的变量,WITH语句列出左侧出现的变量。0 K% o0 Q6 a6 l* _2 t7 w4 \1 n
    四、PARTIAL语句
    2 Z8 N2 o8 j' n& }' s' Y3 Q6 H& ^PARTIAL变量表 指明求偏相关时的偏变量名,同时激活NOMISS选择项。5 f9 ?3 }" a' p
    $ k3 ~2 f+ ^5 T" _
    应用实例( i9 C1 [# B  U! o% i! A# n& U
    例1 一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进县测定1956~1964年3月下旬至4月中旬旬平均温度累积值(x,单位:旬.度)和一代三化螟蛾盛发期(y,以5月10日为0)的数据见表1,试计算x和y的相关系数和决定系数。
    4 y  w1 |6 w1 {4 j) n4 L表1 累积温和一代三化螟蛾盛发期的关系数据  H, X* _5 N- O+ a$ ^
    X累积温        35.5        34.1        31.7        40.3        36.8       40.2        31.7        39.2        44.2
    . E+ \2 v$ n( b1 Q. {9 BY盛发期        12        16        9        2        7        3       13        9        -1
    ' s5 T% ?; |0 [! g       程序及说明
    •    DATA new;
    •     INPUT x y@@;
    •   CARDS;
    •      35.5 12 34.1 16 31.7 9 40.3 2 36.8 7 40.2 3 31.7 13 39.2 9 44.2 -1
    • PROC CORR;
    •   VAR x y;
    • RUN;
      ( Z% k8 @+ |. X' S
    0 j. J) v/ j4 o4 v7 e6 @4 o, q

    ●        输出结果及说明
    * Z3 X' p, E% h; m. q2 M                                 Correlation Analysis相关分析
    ( c8 ~8 `- n! m( d9 S                          2 'VAR' Variables:  X        Y      
    2 O3 c# K' D0 M- {; c7 l         Simple Statistics
    % d1 W) ]/ N+ A' F简单统计
    ! @, l, C3 H- D6 J7 r9 D" tVariable      N         Mean      Std Dev          Sum      Minimum     Maximum! S: l, r, Q0 k: u" e
    变量名      观察值个数 平均数    标准差          总和      最小数        最大数" t/ M8 Y- f1 b6 H3 k7 T" k
    X            9     37.07778      4.25199    333.70000     31.70000     44.200004 s  u" F) ?* v) e% ?8 g4 d
    Y            9      7.77778      5.58520     70.00000     -1.00000     16.00000' P! Y* C9 a  c6 X5 v
    . g* R7 ?- \9 H  A7 z& A! V
           Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0 / N = 9  
    + \( i' K' x  {" ?; y      PEARSON相关系数4 F7 `* y3 f1 \# c5 A
                                              X                 Y
    9 s- i( |- J2 K; H# n2 ]" k                        X           1.00000          -0.83714
    ; D. p% z9 t( B" Y                                    0.0               0.0049( c1 O7 ~% N2 B9 h; s" M8 c
                            Y          -0.83714           1.00000
    0 M& |2 m* `) [  I5 R! F  E' I                                    0.0049            0.0   - m2 L: H/ J3 J5 S( c! K& u
    可见,x与y相关系数为-0.83714,概率为0.0049,达到极显著水平。$ l* q0 ~# L8 e/ O8 R; i2 p* `, Z
    例2 测定13块中籼南京11号高产田的每亩穗数(x1,单位:万)、每穗粒数(x2)和每亩稻谷产量(y,单位:斤),得结果如表2。试分析每亩穗数、每穗粒数和亩产量间的相关。
    4 N# J, U( n1 l) Y; P% b6 C: _' `5 \0 I表2 每亩穗数(x1)、每穗粒数(x2)与亩产量(y)- i7 @" d' P* _* k& t/ x3 `+ B
    x1        x2        Y        x1        x2        Y        x1       x2        Y( x+ ~: S/ V; V$ e! \. K& L. M
    26.7        73.4        1008        33.8        64.6        1103       31.5        61.1        1004! H4 K3 z" ^" G( N, Q
    31.3        59.0        959        30.4        62.1        992       33.1        56.0        9955 X# H' ~6 m/ \* y1 ?
    30.4        65.9        1051        27.0        71.4        945       34.0        59.8        10451 \# b% j0 ?3 |5 K9 Q: J6 U
    33.9        58.2        1022        33.3        64.5        1074                      . a' p1 M! l% w: O' P7 c( ~( P
    34.6        64.6        1097        30.4        64.1        1029                      5 K0 p2 c5 j/ g) H9 S0 W
    ●        程序及说明

    •    DATA new;
    •    INPUT x1 x2 y;
    •    Cards;
    •       26.7    73.4    1008
    •       31.3    59.0    959
    •       30.4    65.9    1051
    •       33.9    58.2    1022
    •       34.6    64.6    1097
    •       33.8    64.6    1103
    •       30.4    62.1    992
    •       27.0    71.4    945
    •       33.3    64.5    1074
    •       30.4    64.1    1029
    •       31.5    61.1    1004
    •       33.1    56.0    995
    •       34.0    59.8    1045
    • PROC CORR NOSIMPLE;
    •   VAR x1 x2 y;
    • RUN;' v; I) a+ Z) i$ m: D  G
    + I# N  Y' X! k2 }& ~; @
    2 w+ f, t7 z$ q% r0 W7 ^/ {& ~2 o2 s( C
           输出结果及说明
    . p% _% P& S# M- r" d5 g) k7 ~+ T                                 Correlation Analysis6 W9 ]6 ~+ a& N& e
                         3 'VAR' Variables: X1       X2       Y        Y* h: Z5 U4 u( O% _
          Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0 / N = 13 ' p- F* E+ Z2 [5 F
                                    X1                X2             Y' E; ~3 N5 U6 g, B
                  X1          1.00000          -0.71738          0.62939. G" r$ W+ w8 V5 y' Q( z. F% t4 x
                               0.0               0.0058            0.0212: S) D  [' A/ U9 L+ ~
                  X2          -0.71738          1.00000          0.01347
    - ^  i9 @  g9 }! ?7 C( {3 c                            0.0058            0.0               0.9652% u  e4 G8 v5 l" z
                  Y            0.62939          0.01347          1.00000
    ! s9 a$ f; f, j7 O* N& U( @                            0.0212            0.9652          0.0   # W0 j5 A8 b% m$ P4 j
    由相关分析可知,x1和x2间的相关系数为-0.71738,达极显著水平(P=0.0058<0.01);x1和y的相关系数为0.62939,达显著水平(P=0.0212<0.05);x2和y的相关系数为0.01347,未达到显著水平(P=0.9652>0.05)。' R5 F8 \; S- q$ f% S$ p
    ' |: A" H% }. ]& A0 G0 c' l
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    樂淘淘        

    2

    主题

    12

    听众

    4

    积分

    升级  80%

    该用户从未签到

    自我介绍
    AAO
    回复

    使用道具 举报

    废材        

    5

    主题

    15

    听众

    420

    积分

    升级  40%

  • TA的每日心情
    慵懒
    2019-9-21 12:34
  • 签到天数: 177 天

    [LV.7]常住居民III

    网络挑战赛参赛者

    自我介绍
    数学建模新手

    邮箱绑定达人 社区QQ达人

    群组2017美赛备战交流群组

    群组2016国赛备战群组

    回复

    使用道具 举报

    废材        

    5

    主题

    15

    听众

    420

    积分

    升级  40%

  • TA的每日心情
    慵懒
    2019-9-21 12:34
  • 签到天数: 177 天

    [LV.7]常住居民III

    网络挑战赛参赛者

    自我介绍
    数学建模新手

    邮箱绑定达人 社区QQ达人

    群组2017美赛备战交流群组

    群组2016国赛备战群组

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-16 06:28 , Processed in 0.542105 second(s), 71 queries .

    回顶部