QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4441|回复: 0
打印 上一主题 下一主题

回归模型的判断方法

[复制链接]
字体大小: 正常 放大
浅夏110 实名认证       

542

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2020-11-14 17:15
  • 签到天数: 74 天

    [LV.6]常住居民II

    邮箱绑定达人

    群组2019美赛冲刺课程

    群组站长地区赛培训

    群组2019考研数学 桃子老师

    群组2018教师培训(呼伦贝

    群组2019考研数学 站长系列

    跳转到指定楼层
    1#
    发表于 2018-10-31 11:25 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta |邮箱已经成功绑定
    在回归模型中,需要判断模型是否很好地拟合实际数据,一般来讲会有以下方法:
    + u  i9 |6 S9 \; [, C$ @  W: N$ A1 H1 f  R1 v- J
    R平方:表示Y变量中的方差有百分之多少是可以预测的,R平方越高,Y中的方差就预测得越准确,模型的拟合程度也就越高。2 z1 X' k4 X! ^4 Y" u
    3 D. ]  v* b5 u+ L3 R
    举个例子,R平方=10%,表示Y中有10%的方差是可以通过X预测出来的。% z, l* z$ ]8 T$ l7 d

    " {9 K" @) o) x8 y! i/ j2 q$ ]8 CF检验(F - test):主要用以判断两个总体(Population)的平均值是否存在显著差异(Significantly different),因此我们可以判断预测值跟实际值两组“总体”数据的平均值是否存在显著差异,如果存在,则可以认为回归模型拟合得不够好。如果F - value大于F值的统计量,我们认为拒绝原假设(两组数据不相关),则x和y(预测值和实际值)是线性(或者非线性)相关的,反正就是两组数有关。8 J/ P, H- }( ?! e7 J8 N

    " |) P/ J! C+ U  XT检验(T - test):T检验相对F检验来说,更关注回归方程中每个变量的显著程度,可以说F检验是评价模型整体的拟合程度,而T检验是评价回归方程中每个特征x变量的系数的显著程度。在这里,系数是跟0比较的,如果T - value大于T值的统计量,我们认为该特征的系数显著大于0,因此不可以忽略,需要考虑该特征,回归方程中也要保留该特征,如果小于T值统计量,则接收原假设,认为该特征系数跟0没有显著区别,我们可以忽略该特征。' c1 F; i' @, W) w  s( E/ e

    3 b" K4 {; _/ {/ j AIC(Akaike Information Criterion):AIC是一种信息准则,它提供的是一个参考标准,也就是说,仅仅通过一个AIC值我们并不能得出回归模型的拟合程度,它更多的是通过多个AIC值对比不同回归模型。AIC的公式如下: 0 O; Z3 T3 e6 j9 n
    % U/ {: q3 p4 d- d$ ~8 n
    其中L是似然函数,K是参数数量,而如果总体数据(Population)的误差服从独立正态分布的时候,AIC公式变成:- e7 G" H( f* S- }& s

    . B/ {; D2 Q" y9 f/ q' Q1 ~其中N是数据的数量(观察数),K是参数数量,SSE(Sum of Squared Error)是误差的平方和。
    9 i) W8 T2 s, w1 b4 X
    * W2 T  q1 W- y% _* f$ B: qAIC综合考虑了模型的拟合程度以及复杂程度,参考上述正态的公式,当SSE越大的时候,也就是拟合越不好,AIC值也会随着增大;同理,如果参数数量增多,也就是模型复杂度越大,AIC也会增大。单个AIC值参考的意义不大,但如果有两个或者多个AIC值在一起的时候,我们比较两者的AIC值,越小越好。因为考虑了模型复杂度,因此AIC减少了过拟合的可能性。 + c( S3 k  I: p, D' X9 n

    ' ?7 b3 h7 |2 c3 {* E$ N2 S4 RBIC(Bayesian Information Criterion):BIC跟AIC类似,同样提供拟合模型的信息准则,相对AIC,其对模型复杂度的惩罚更大,它的公式如下:
    ' O8 }7 z, c' O; W4 v7 M' C) R' p3 o/ Y$ v/ D$ D9 V
    其中L是似然函数,K是参数数量,当误差服从正态分布时候,BIC公式变成:
    $ N* M7 d9 v+ o: w% k9 P: ?
    5 V5 Q# t  _8 v; C+ w; P3 F  M5 Y可以看出,当训练样本较小的时候,而模型过于复杂的时候(参数K过多),惩罚较大,BIC会增大,可以避免维度过多的情况。
    6 C/ b; i9 t2 n1 q+ B* c# f+ b9 ?6 c, ?7 R0 M5 h( [& A$ |( k1 E
    # D! G3 k2 i; v. O
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-15 09:12 , Processed in 0.409554 second(s), 51 queries .

    回顶部