TA的每日心情 | 奋斗 2024-7-1 22:21 |
|---|
签到天数: 2014 天 [LV.Master]伴坛终老
- 自我介绍
- 数学中国站长
群组: 数学建模培训课堂1 群组: 数学中国美赛辅助报名 群组: Matlab讨论组 群组: 2013认证赛A题讨论群组 群组: 2013认证赛C题讨论群组 |
2#
发表于 2014-9-3 22:21
|只看该作者
|
|邮箱已经成功绑定
赤池信息量准则(Akaike information criterion、简称AIC)是衡量统计模型拟合优良性的一种标准,是由日本统计学家赤池弘次创立和发展的。赤池信息量准则建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性。
|, _" g R r, c3 h
: G+ e7 W' S& m* b& GAIC1 h/ R, z" b3 J$ C% l3 |6 k
在一般的情况下,AIC可以表示为:
" p/ M6 j9 O- J3 }- D
" S& a1 k8 d2 z( T* `0 B- O' o8 q其中:K是参数的数量,L是似然函数。+ S, i( k! A) B) o% ~+ w" m
假设条件是模型的误差服从独立正态分布。
" d- ?( q* S* I让n为观察数,RSS为剩余平方和,那么AIC变为:2 l9 u4 V. Q- y( e
+ A7 j7 m7 e4 ?5 g9 z7 R% Z
增加自由参数的数目提高了拟合的优良性,AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合(Overfitting)的情况。9 T' J: a! v9 o" m
所以优先考虑的模型应是AIC值最小的那一个。赤池信息量准则的方法是寻找可以最好地解释数据但包含最少自由参数的模型。- T" ~3 q4 X/ Y( z- l# n/ ^9 p
AICc和AICu
1 p6 g( P7 A/ r0 Y; k/ q* m在样本小的情况下,AIC转变为AICc:7 K# c3 x5 r( |& a
4 o. e; ^ x2 ]) R当n增加时,AICc收敛成AIC。所以AICc可以应用在任何样本大小的情况下(Burnham and Anderson, 2004)。
" P4 H- ]+ C. b8 CMcQuarrie 和 Tsai(1998: 22)把AICc定义为:
( b: t- E* o6 B ( [9 R3 P( G8 d. Z* M8 t
他们提出的另一个紧密相关指标为AICu:) W% ^0 U( @( p9 J3 D. {% K
% M! z- P' ]+ WQAIC
; W, [3 a" M2 g6 Z( o- h, B% M5 tQAIC(Quasi-AIC)可以定义为:
+ D$ g2 q1 b; m6 E& } ' h3 @( c0 j. H9 G
其中:c是方差膨胀因素。因此QAIC可以调整过度离散(或者缺乏拟合)。
, t+ v# j0 j7 N2 j0 ?# ]$ X6 _+ _在小样本情况下, QAIC表示为:
: s, P3 l+ y8 ~( u4 J6 t: G i.. g i' Q( `( O8 E
参考文献
) X( F# Z" y( J7 W0 T/ i- UAkaike, Hirotsugu(1974年).A new look at the statistical model identification.IEEE Transactions on Automatic Control,19(6):716–723.8 f6 t5 i! e' B0 I( @. i( v; J
Burnham, K. P., and D. R. Anderson, 2002. Model Selection and Multimodel Inference: A Practical-Theoretic Approach, 2nd ed. Springer-Verlag. ISBN 0-387-95364-7.) d G* F( n2 R" I: i7 P
--------, 2004. Multimodel Inference: understanding AIC and BIC in Model Selection, Amsterdam Workshop on Model Selection.) G1 r, n& Y! j- _. v
Hurvich, C. M., and Tsai, C.-L., 1989. Regression and time series model selection in small samples. Biometrika, Vol 76. pp. 297-307! N4 G$ A1 K# S+ o# @
McQuarrie, A. D. R., and Tsai, C.-L., 1998. Regression and Time Series Model Selection. World Scientific.9 i& F0 x5 i. X& Z- j# S$ y
0 n) o6 I3 @, X7 P. f1 j* d6 Y
准确建立VAR模型的关键在于滞后期数的确定,在实际应用中,一方面希望滞后期p足够大,可以更加完整的反映构造模型的动态特征;但另一方面,滞后期越长,模型中待估参数越多,损失的自由度也越多。因此,在滞后期和自由度之间寻找一个均衡点,一般根据AIC和SC信息量取值最小的准则来确定模型的滞后阶数。根据多次的实际测算,最后确定滞后阶数为4,模型设定为VAR(4),采用OLS得到估计式如下,模型整体拟合程度较好。
# V) {4 A0 c( J' {8 \# M! Q对模型进行稳定性检验以及残差自相关检验,结果显示模型稳定且整体拟合度较高,各扰动项不与自己的滞后值相关,模型拟合效果良好,可以作为进一步分析的依据。
G- z+ j' R4 g6 D7 N) A' I
# p* D# N7 S# `0 |单位根检验与协整分析$ u5 P! W$ `& w) N
在对时间序列进行分析时,传统上要求数据是平稳的,即没有随机趋势或确定性趋势,如果用非平稳的时间序列变量进行回归,会出现“伪回归”现象。但是,现实经济中的时间序列往往是非平稳的,为了使回归有意义,对时间序列实行平稳化处理,方法是对其进行差分后再回归,但这样做的缺点是会失去原序列中的有用信息,而这些信息对问题分析又是必须的。Enger和Granger提出的协整方法很好的解决了这个问题,而协整分析需要进行单位根检验。单位根检验的方法很多,如DF方法、ADF方法,PP方法,本文采用ADF方法。+ r$ y# a) x1 m! @
我们对各变量进行ADF检验,经过多次尝试,选择最佳滞后期和检验形式,得到单位根结果如表2。从表2可以看出,在1%的显著性水平下,所有变量序列的水平项都是非平稳序列;经过一阶差分以后,在0.01的显著性水平上都是平稳的,故它们都是一阶单整I(1),可以在此基础上进行协整检验。
2 Y+ p. y, K1 X6 {- R. h% P: R由于VAR模型对滞后期的选择比较敏感,故先采用AIC或SC最小原则确定最佳滞后期。在滞后期数确定滞后,再对协整中是否具有常数项和时间趋势项进行验证,然后对数据进行协整检验,得到的结果如表3。从表3可以看出,GDP与两个协整方程,变量之间存在着长期的均衡关系。通过对各协整方程残差进行ADF检验,结果显示残差为平稳序列,也证明了经济增长与传统服务出口份额、传统服务进口份额之间存在着协整关系。+ D% z% k+ o! Z+ ^$ V; p8 w
AIC准则是赤池信息准则,该项准则运用下式的统计量评价模型的好坏:AIC=-2L/n+2K/n,其中L是对数似然值,n是观测值数目,k是被估计的参数个数,AIC的准则要求其越小越好。
5 _" z" ]- n+ X% L2 J因为,AIC的大小取决于L和k。k取值越小,AIC越小;L取值越大,AIC值越小。k笑意味着模型简洁,L大意味着模型精确。因此AIC和修正的决定系数类似,在评价模型是兼顾了简洁性和精确性。
' w7 J; j* J7 S" A' g赤池信息量准则(http://en.wikipedia.org/wiki/Akaike_information_criterion) 概念:赤池信息量准则,即Akaike information criterion、简称AIC,是衡量统计模型拟合优良性的一种标准,是由日本统计学家赤池弘次创立和发展的。赤池信息量准则建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性。; ^6 Y" D% q) A$ r
0 m" R' b+ o& m2 ~1 E
AIC和BIC是同一个指标,一般用于选择模型,也就是模型的比较优劣/ o0 ], Q) F% u
他们的不同之处在于
) q7 W1 @; Q# M* c& y- i& oAIC=-2 ln(L) + 2 k 中文名字:赤池信息量 akaike information criterion; L9 l& ?$ c3 l
BIC=-2 ln(L) + ln(n)*k 中文名字:贝叶斯信息量 bayesian information criterion0 u: T1 ]: S3 G, n
HQ=-2 ln(L) + ln(ln(n))*k hannan-quinn criterion
- Y) J5 E; r5 A R j 8 x) M0 h0 t# j- r9 C) Q
$ T- D' V) g! {/ w! u+ r+ }0 h8 P
构造这些统计量所遵循的统计思想是一致的,就是在考虑拟合残差的同时,依自变量个数施加“惩罚”。
9 Q/ ?: Y5 b4 q' U3 f但,倘若因此就说它们是同一个指标,恐怕还是有些不妥,毕竟“惩罚”的力度还是不尽相同的。7 U0 i6 q- Z5 S; D: l2 P
此外,这些信息量的用途不仅限于选择模型,还能用于选取合适的变换等等。而在那些时候,这些信息量又是另一个模样,也就是说它们有许多变体。因此,它们也被称为AIC准则、BIC准则等等。它们中的每一个体现的都是一系列的标准,而非单独的一个简单式子。 y$ N ~6 A$ o/ m# O/ b. W
; W+ F/ ?) o6 [+ V* ?. s
20世纪50年代,统计检测理论发展很快,米德尔顿等人用最小平均风险准则(贝叶斯准则)来处理最佳接受问题,使检测理论发展到一个新阶段,并使各种准则统一于风险理论。 |
|