QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1286|回复: 0
打印 上一主题 下一主题

数学建模之回归分析

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2020-3-13 15:12 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    : k' k1 x' D% L! C! Q5 s
    . Z0 E# ^5 H# f) N2 K* r/ w+ A& p
    数学建模之回归分析
    % F9 p4 s" E( G/ M

    ! V  z$ d* {! r* _: ~: Z4 d应用场景
    . u9 Q6 _8 i% @8 _1. 建立回归模型" @* i: N! q5 Q% n5 h- b5 ]0 n6 r
    1.1 筛选变量3 L5 `( f8 c- v
    1.1.1 确定样本空间' {' F8 W, |" B# W6 q5 X5 _- [
    1.1.2 对数据进行标准化处理
    & e' X. Q# g% w* w1.1.3 变量筛选
    + O6 h5 W. h; z2 O1.1.4 调整复判定系数
    & K7 r6 k0 d. B2 R7 g2 y) `2 u1.2 最小二乘估计
    5 i' g$ ]; a4 D8 |5 R2. 回归模型假设检验- n* h2 I8 g* @9 U& _+ @
    3. 回归参数假设检验和区间估计
    7 t9 P; w+ ^& e( V! @4 q4. 拟合效果分析& Z$ B) Y' \9 U; B
    4.1 残差的样本方差(MSE)
    ) f0 h7 K: B* S, b& Q& A* @8 L1 e6 I8 p4.2 判定系数(拟合优度)& ~" E3 l+ v& Y, l6 i% p# q
    5. 利用回归模型进行预测+ n" ~% f5 [* t9 N. [# E5 a3 O& H1 i
    其他: B- W! v: E: l! ]6 ^3 L4 r2 t6 w
    偏相关系数(净相关系数)
    : C7 P+ l7 U& V, ?+ e8 m1 o复共线性和有偏估计方法4 @% h) \! Q* \$ E4 ?+ h
    小结
    : h' E$ a0 ~4 T- O( A6 G0 n- a8 m应用场景, f+ {; Z7 ~# |

    ' [3 d( Q4 T- w( u. E! j8 S简单地说,回归分析是对拟合问题做的一种统计分析。! t! k" R: k& f; d. j* }2 m
    P.S. 曲线拟合问题的特点是,根据得到的若干有关变量的一组数据,寻找因变量与(一个或几个)自变量之间一个函数,使这个函数对那组数据拟合得最好。通常。函数的形式可以由经验、先验知识或对数据的直接观察决定,要做的工作是由数据用最小二乘法计算函数中的待定系数。
    : {# b8 ?' a  Z, U. q- D0 S
    & e6 D! V8 j$ D2 V4 U具体地说,回归分析在一组数据的基础上研究以下问题:7 b  h) F( P, M; W" z# @
    12.png 0 X. s2 b# L$ _. \% K
    1. 建立回归模型  Q! D: ]9 x( b  P
    9 ~% v1 Z9 F  J
    1.1 筛选变量( I5 T1 C' v' l" M
    ! @4 Y2 @9 B4 l* b3 M& V
    1.1.1 确定样本空间/ i. j1 I# I$ m7 ~" }# g$ T+ p
    11.png
    . `4 Z9 C& D  Z5 V7 g- e2 W: K% V. @- s
    所构成的数据表可以写成一个n×m n \times mn×m维的矩阵。- W+ U( f. |$ j( h

    % m$ c  e6 J& G' q! Q& m! o1.1.2 对数据进行标准化处理
    ; B& w4 x! ~7 w+ S) f" S; C
    $ `% |0 o. Q, A2 o; c* y+ K6 ](1)数据的中心化处理6 [9 L1 V' ^2 T/ V; s; J% i
    实际上就是平移变化,
    . K2 p; g7 K& {4 p1 r: ~% y. H$ `0 X
    10.png ' D. F( V) Y! e+ {. \
    这种处理,可以是样本的均值为0 00,同时它既不改变样本点的相互位置,也不改变变量间的相关性,但变换后,有许多技术上的便利。" Z) t6 ~$ X' L
    (2)数据的无量纲化处理$ q6 S! L6 s2 _) s2 b& |& O2 v
    在实际问题中,不同变量的测量单位往往是不同的。, G% W" |' Z. S, O
    为了消除变量的量纲效应,使每个变量都具有同等的表现力,数据分析中常用的消量纲的方法,是对不同的变量进行所谓的压缩处理——使每个变量的方差为1
    9 ?6 S7 S8 j7 \: b, R4 V, v即,+ d4 `) D  m7 J' `- x* p

    ' U: `6 u# B+ C3 {; D 9.png * B& z/ y4 M2 w1 {; u( l
    当然,也有其他消量纲的方法,此处不一一列举。" u" J! V9 j/ Y
    (3)数据的标准化处理——对数据同时进行“中心化-压缩”处理
    ; A2 a7 Y, M4 I0 I0 H* m0 ^9 ^即,
    4 u& r3 y/ V1 h6 d9 c2 h, x! j* ]+ W  |4 `/ `, B( h
    8.png 8 {8 |; e0 F( Q( }
    1.1.3 变量筛选8 |7 F+ Z' X0 x! |- h* F0 |1 ?

    ( g! N- t4 O2 X. R7 M  J8 ?2 X——选择哪些变量作为因变量的解释变量:( u! |: a1 g5 v* u" P5 B# j
    , t' M$ {* `+ |/ X6 e
    一方面,希望尽可能不遗漏重要的解释变量4 s% b. Q+ |/ u0 ^) ]
    一方面,遵循参数节省原则(自变量数目过大时,模型计算复杂,且往往会扩大估计方差,降低模型精度),使自变量的个数尽可能少* h! t& h5 u0 Q/ R7 y
    (1)穷举法9 }, |9 D" ^# q5 Y4 C- G
    列举出所有可能的潜在变量,再根据自变量的不同组合,选取合适的模型。
    * K! M. m9 d* z# i0 T% x假设有m mm个潜在变量,则需要拟合与比较的方程个数为2m 2_m2
    * @$ b$ z! _# s6 \3 ]$ Wm. \  l  k% _+ i# ^. _; c
    ​        " c0 N" d, X% n- y6 q3 [
    ——当m mm较大时不现实
    % |% p7 X) ^1 L# `
    6 K8 }  j5 U& q; T(2)向前选择变量法
    1 j% b5 l* G6 a* o# ]0 K# i 6.png
    + I* Z% B" `3 T1 N) E0 g! ]) ]) Z5 z( ~
    & T6 h7 u9 a3 _+ k& c. U9 g$ ?. L$ [; b& l: W
    % e2 C. v, y: Z" Z# ^
    7.png , s0 z8 _4 U7 ?+ U# s1 m
    5 {3 N% T9 N1 ?! O
    (3)向后删除变量法
    1 T/ C" j8 j) A: |" H$ Z 4.png % ^9 Z. h4 F, s+ n9 a/ {3 I* j
    (4)逐步回归法——最常用
    + U3 |% C5 w4 j/ p6 I& Y 5.png . @' F5 r+ V) R% a( S

    , x  r, \, s2 s7 c& D* s1.1.4 调整复判定系数
    : ^& p) i8 h$ K, {2 j. V 3.png
    & G/ T& x6 \% L1.2 最小二乘估计
    ' _" H- B9 z( L8 P1 ]
    ! g) W# z5 k% Z" _一元线性回归、多元线性回归——略。, A5 x* T2 O$ d! i2 E% K

    . c& a4 O% D( I* l- n* c2 p1 f. X" h2. 回归模型假设检验" f* M/ u/ \8 |% f" y+ y7 B
    - S/ |0 F5 C' E3 o7 u
    ——检查自变量与因变量之间能否用一个线性关系模型表示(F FF检验)' h& q* Y( W  y8 Q# t

    0 T" t% s% `$ |8 S具体检验方法见书,此处不再赘述。4 p& u6 l" Y5 B* k5 h- K( {- c
    ' n4 _8 h& j) K; W# t! V
    3. 回归参数假设检验和区间估计' \- j6 \3 D+ E9 b4 ]+ W

    - o0 h. o; G' o  q  Q" a——检查每一个自变量对因变量的影响是否显著(t tt 检验)
    ) }( ]) N9 P$ m/ M" m7 f9 n3 Q; ]0 h
    具体检验方法见书,此处不再赘述。7 r+ p! x6 S/ D  u/ x4 z

    " T& e! }6 W3 i! \/ z( u4. 拟合效果分析' ?9 D( F% s1 j: E2 O
    ; E' ~9 ^6 D7 i6 G. N+ C. \
    4.1 残差的样本方差(MSE)
    - `4 U* ~8 x/ q8 H9 L9 H8 g 2.png
    . [) }' [0 B2 U7 u! |! k, q: [8 K' Z; |% l
    4.2 判定系数(拟合优度)
    . c* K  J& Z0 t' F; x5 @: Z
    & I, Y$ ~2 V/ D4 e- M9 Q7 ]' g! B/ ? 360截图165011039490135.png ; M9 `. k; u7 O( ~) y% R( q0 O
    ) c1 e" C$ c) s) M
    5. 利用回归模型进行预测
    3 F/ J5 ]& Y+ m3 p2 D, M' f7 M7 x! i- q% F/ d/ Y. O

    & c; o% |, [$ Z: H* p8 B7 M2 \4 w- B6 b: L. H4 F0 ]' \
    其他/ ?- J4 `1 p( c, [

    1 s9 e% I  [+ u5 J7 D8 k, H偏相关系数(净相关系数)6 N9 X2 s6 ]$ t  W/ U! s& E
    ! f/ f; M- O: O' W' [3 f4 F+ y
    在研究两个变量之间的线性相关程度时,可考察这两个变量的简单相关系数。但在研究多个变量之间的线性相关程度时,单纯使用两两变量的简单相关系数往往具有虚假性。因为它只考虑了两个变量之间的相互作用,忽略了其他变量对这两个变量的影响。0 E9 z$ F" i& H0 G

    , k9 u3 z8 v% W. u复共线性和有偏估计方法; m" {5 x# t$ W% F! H3 |( H3 o4 L- R

    ; q. O+ z% |* g9 {' I在一些大型线性回归问题中,最小二乘估计不总令人满意,比如系数正负号与实际意义不符,这可能是因为回归自变量之间存在着近似线性关系——复共线性(Multicollinearity)3 d9 U4 r0 m* v

    9 z8 F. S1 c, G. e+ z* N: J4 \3 [解决方法——牺牲无偏性,改用合适的有偏估计方法,以改善估计的稳定性( E. f9 N- u* ]$ _5 c; s7 E
    例如,岭估计——可以显著改善矩阵列复共线性时最小二乘估计量的均方误差,增强估计的稳定性。! S% `2 Y3 _: b* V0 k
    (P.S. 均方误差Mean Squared Errors:一个好的估计应该具有较小的均方误差)
    ) B* ~) T/ m6 o5 m7 B* s2 K, T1 x( l+ h- }$ s8 n6 y8 @  o
    再如,主成分估计——可以去掉一些复共线性
    + _3 c% m# q' p2 s3 a7 p5 Z
    ) ^2 u. m, y/ A0 a% X9 v2 r小结1 R' m) l( E, d# g$ W0 N

    2 _# G% \6 J7 H8 Z3 w采用回归模型进行建模的可取步骤如下:& g7 E" Z6 j. |* J' _

    1 _) x. }% }. M0 q$ I! }建立回归模型6 F, U" @- f" e7 v3 z* V
    确立样本空间,对数据进行标准化处理,采用逐步回归法筛选自变量$ t- j& N  S' Y3 o
    原文链接:https://blog.csdn.net/xxiangyusb/article/details/99762451
    & i' X4 q8 \& G+ W$ ~+ r- v! }
    ! P2 n( O; h1 ~4 d3 i, G
    ; S% V$ C/ S) `( D- G( I5 d; Q5 D: h
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-9 03:14 , Processed in 0.466341 second(s), 54 queries .

    回顶部