季节调整和预测的结构时间序列模型方法研究∗ y' \7 h. N& y( j R2 E 陈 磊 李 忠# `8 q9 ]4 c4 d2 w( s# p6 O 内容提要:本文首先介绍了结构时间序列模型的特点、基本构成以及状态空间表示。然后利用该模型对月度社会消费品零售总额等经济指标进行了时间序列分解和季节调整,取得了令人满意的结果。将该结果与流行的X-11方法加以比较研究的结果表明,在季节调整的稳定性(尤其是序列末端的稳定性)方面,通常情况下结构时间序列模型方法比X-11方法的性能要好。最后,本文还利用结构时间序列模型对消费品零售总额等指标进行了实际预测和检验,表明该模型具有较好的短期预测效果,是一种性能可靠的预测方法。! _7 |6 G' Y4 W7 }% N) F 关键词:结构时间序列模型,经济时间序列分解,季节调整,预测3 u) d9 g/ e6 z$ S. ` 经济景气的监测和预警是以准确考察每个景气指标的变动特征为基础的。为了真实反映经济的运行情况,对月度或季度景气指标进行适当的时间序列分解以消除季节因素的影响又是其中的一个基础环节,时间序列分解和季节调整的结果将对景气分析和预测产生直接影响。目前,我国及世界其它很多国家采用的X-11季节调整法的主要缺陷是序列两端损失信息过多,在一定程度上影响了调整和预测的效果。: j) T% I& N8 Y6 d$ c 20世纪80年代末以来,英国统计学家和经济计量学家哈维(A.C.Harvey,1989)等人采用现代时间序列分析理论和方法所提出的“结构时间序列模型”,为经济时间序列的季节调整和预测提供了强有力的崭新工具,受到国际上的广泛关注和应用。) ` ^, g+ U5 e9 q R q 一、结构时间序列模型的特点及基本构成: l* u9 g4 |" c: R" c' [ 一般意义上的结构时间序列模型是指由我们感兴趣的、具有直观解释的成分或因素直接构成的一类统计模型。在经济学领域中,结构时间序列模型通常是指将经济指标由其自身的趋势、循环(周期)、季节及不规则因素来表示的模型。这种结构模型的着眼点并不在于精确表示数据的生成过程,而在于通过将序列分解成各成份来表示序列的“典型事实”。与传统时间序列模型相比,它对经济变量的描述更为清晰、明确和灵活,特别是更容易准确表达序列的基本趋势和季节变动特征。将分解出的季节因素从原序列中剔除掉,便可达到季节调整的目的。同时,利用这一模型也可对序列的未来值进行外推预测。 结构时间序列模型的灵活性还有助于克服传统的Box-Jenkins时间序列分析方法只适用于平稳(或准平稳)序列的局限,从而使多数为非平稳的经济时间序列的研究和应用大为扩展。此外,根据需要,还可在模型中加入解释变量和干预变量,以提高模型的稳定性和可靠性。 我们知道,经济时间序列{一般由趋势T、周期(循环)C、季节和不规则因素等分量构成。其加法模型为}tYtttStI① tttttISCTY+++= (1)5 G# ?) J8 X8 X2 R& v ∗该文主要内容原载于《数量经济技术经济研究》2000年第11期增刊。 ① 在下面的叙述中,各模型都是通过加法形式将各分量组合在一起的,如果认为用乘法模型更合理,则只需先对序列取对数即可变成加法模型。 14 | `+ j: L6 v" B1 [ 根据经济序列中可能含有的各分量,结构时间序列模型可以有几种不同形式的基本模型,而描述各种分量的模型也不唯一。% }% F6 h2 l- @$ q$ G 趋势表示序列中的长期运动,并可以外推到未来,它是结构时间序列模型中的最基本的因素。趋势通常有随机游动趋势、带漂移的随机游动趋势和随机增长趋势等多种形式,常用的随机增长趋势模型为: tT tttttttvbbubTT+=++=−−−111 (2)+ L" ]8 R8 V+ p, p/ o* ^: S7 M 其中和分别是零均值、方差为和的白噪声且互不相关,b相当于随机性斜率。这种趋势也称为局部线性趋势。容易验证,这种趋势满足二阶差分约束,即在二次差分后,可变成白噪声。 tutv2uσ2vσt3 n$ y& S6 c. V3 _! O* o! e# }3 H 循环变动C是以数年为周期的平稳波动,但波动的周期通常不是固定的。故应满足某一平稳ARMA模型。为便于参数估计,根据ARMA模型可转化为对应的AR模型的性质,可采用充分高阶的自回归模型即AR(p)来拟合,即有 t tptpttteCaCaCaC++++=−−−L2211 (3)4 M, c* x; o1 l& { 其中是均值为零、方差为的白噪声。 te2eσ4 T5 v q- ?6 `3 a& s0 l4 R! a 季节性分量是以一年为周期的波动。它可采用虚拟变量形式和三角函数形式两种表示方法,这里只介绍前者。设一年中的季节数为s(对季度或月度数据s分别等于4或12),则虚拟变量形式的(一阶)随机季节模型如下: tS2 Z/ T+ F7 L @ tsjjtwS=Σ−=−10 或 (4) tsjjttwSS+−=Σ−=−11/ _# C' f a$ j$ T 其中,是均值为零、方差为的白噪声。 tw2wσ 在实际应用中,可根据具体情况对各分量进行组合以构成各种形式的结构时间序列模型,并可加以修改和推广。这些模型既可用来描述时间序列的特征,又为预测提供了基础。 二、结构时间序列模型的状态空间表示 由于结构时间序列模型直接针对指标中不可直接观测的成份建立模型,传统的回归分析对此无能为力,因此,在统计处理上采用了状态空间模型形式。状态空间模型不但可以利用状态向量表示不可观测的各成份,还可以利用卡尔曼滤波这一强有力的递推算法,对各分量进行最优估计、平滑和预测。卡尔曼滤波还可用于似然函数的计算,按极大似然原理较为精确地估计模型中的各参数(即超参数)。① W. N: J! V) G$ I" C6 V 状态空间模型(不带外生变量且时不变)的一般形式如下:; u; `) }% O2 |- B: b2 X 量测方程式:NtZyttt,,1,L=+=εα (5a)7 | E$ S2 W; q# l7 j( R 转移方程式:NtTttt,,1,1L=+=−ηαα (5b)9 O) t' m* h: l+ o 其中,为观测序列,tytα为r维状态向量,tε和tη分别是1×1的扰动项(也称观测误差)和r×1的序列不相关扰动向量,且有# a/ a7 I, ]: u- B; I hEtt==)var(,0)(εε (6a)* x- e7 G' [, C; u+ ? QEtt==)var(,0)(ηη (6b)+ d. k0 v8 @( S7 t NtsEts,,1,,0)(L==ηε (6c)) s0 _! X/ ~3 |( g 2% c) t. n1 H! M$ `. @, ?0 I @ ① 有关状态空间模型和卡尔曼滤波的详细介绍可参见董文泉等(1998)第十一章,或Harvey(1989)第二章。 采用状态空间形式,可以将(2)~(4)式的各分量模型分别表示成如下的状态方程: +. P0 _$ f) l9 m/ S 1 ]6 }: \% M+ X {' X) M = 1 R2 T# r. l) P; ^3 v −−ttttttvubTbT111011 (7); Q7 U( o& H) g- {5 P) k! b, }$ v +=−−−−+−−00010000012112111MMLMMOMLLMtptttpppttteCCCaaaaCCC (8) +−−−=+−−−+−−00011000111112121MMLMOLMLMtstttstttwSSSSSS (9) 将以上三式合在一起,便构成整个状态方程。 另外,由于(2)式描述的随机增长趋势在两次差分后可变为平稳的白噪声,即它满足二阶差分约束,故可以考虑将趋势分量用更一般的满足二阶(甚至更高阶)差分方程约束的模型来描述,从而有:! y5 j* v) g& e7 M ttuT=Δ2 或 TttttuTT+−=−−212 其中,是差分算子。上式对应的状态方程形式可表示为: Δ0 }$ m5 Y) e \ +# `5 `# {/ \/ E4 G9 w r : \2 C- M4 l, R" K: h5 x −=% ^+ m' h. Y" Y i* z L ( K, I! d: P; {9 q3 L8 N R −−−00112211tttttuTTTT (10) 将该式与(2)式对比可以发现,这一模型减少了一项扰动噪声,从而可以使需要估计的模型参数减少一个(即的方差),这有利于提高整个模型的估计精度。但这一扩展对原模型的直观含义有所削弱。 tvtv 对照(5)式的单变量状态空间模型的一般形式,观测序列的结构时间序列模型的完整对应状态空间形式如下: ty/ n& E" }2 O, C8 X0 h []tttIy+=α00100101LL (11a) +⋅−−−−=−−000000100000001111000000010000010000000001000012111MMLMMOMOMMLOMMLLOMMOMMMOLMMLLLLLLLLLttttpptweuaaaαα (11b) []′=+−−+−−−21111stttpttttttSSSCCCTTLLα, 3 扰动项方差阵: )var(tIh=. s/ h d: V- X7 Y )00000(222LLweudiagQσσσ= 状态向量的维数为p+s+1,s=4(季度数据)或12(月度数据),待估计的模型超参数有:,共计p+4个。 pweuaahL,,,,,1222σσσ 对于模型中周期分量自回归阶数p的选取,可利用赤池(Akaike)信息准则即AIC来帮助确定,这一准则在模型选择中得到广泛应用。AIC值由下式计算; _: x; Z, g! l mLKAIC2)ln(2+−= 其中LK为参数估计的极大似然函数,m为模型中的参数个数。可以看出,这一准则同时兼顾了模型的拟合精度及模型参数个数的要求。理论上,使AIC达到最小的p所对应的模型应为最佳选择。 除AIC外,在实际应用时还应考查模型估计出的各分量是否合理。9 \2 d: i6 e D6 g* R! R f 三、结构时间序列模型在季节调整中的应用与对比研究. ^- r' e: m6 g3 L 将结构时间序列模型表示成以上的状态空间形式后,就可利用卡尔曼滤波对模型中的未知参数及趋势、(可选的)周期、季节和不规则项各分量进行最小均方误差意义下的最优估计。将估计出的季节因素从原序列中剔除掉,便可达到季节调整的目的。$ l7 L; \2 T7 j 下面利用结构时间序列模型对代表我国消费水平的重要景气指标——月度社会消费品零售总额进行实际分析,所用数据的时间范围是1990年1月至1999年2月。从这个变量的时间序列图形(见图1)中可以看出,它都具有明显的增长趋势和季节性变动,且季节波动的幅度随时间逐渐加大,这种情况适合采用乘法模型进行时间序列分解。为了便于用加法形式的结构时间序列模型进行建模和估计,可先将原序列取对数化为加法模型,待分解出各分量后再用指数还原。* y! d& Z' p$ B1 ^ (一)模型选择与结果分析4 Q9 R7 w; y5 Z1 n6 r9 H. r. f& k: } 这里采用(11)式所给出的状态空间形式进行具体建模和估计。通常周期分量自回归模型的阶数p的取值范围为0~4,p取0时表示模型中不包含单独的周期分量,其变动由趋势部分所包含。 表1列出了取不同模型阶数p时,社会消费品零售总额结构时间序列模型的参数估计结果和AIC值。从表中可以看出,在五个模型中,p=0时的AIC值最大,表明不包含独立周期分量的模型,其拟合结果相对较差;最小的AIC值出现在p=1时,随着p的增加,AIC值逐渐增大,说明加入更高阶的自回归周期分量,并没有明显改进模型的拟合效果。结合比较不同模型各分量的分解结果,最后确定p=1。此时,对各分量的估计结果见图1至图3。 表1 社会消费品零售总额结构时间序列模型的估计结果 p( M: H0 W! }' l7 `' D" e$ R% ^ 0 1" p, P+ t" N. n 2) y- V( _6 J2 t8 Q" ?# l 36 h! c8 u9 W9 C$ | 4' R: H T( c% e8 g% C0 G AIC 67.74 59.315 59.575 E- w: w2 ]5 X5 M5 \ 61.56 N- h6 X8 [" V/ j+ p" ? 63.11( w8 X C. ~/ B- t Var(It), c3 `! V+ I' [. u I' w4 l; s 0.00006 0.00005 0.00006 0.00006 Var(ut) 0.00705: q, Q6 h4 U( b2 X* Z2 O$ b5 u 0.00738 0.0069 0.006889 u1 C/ B1 J9 C+ Y z3 L) v& G Var(wt) 4.7×10-7 6.6×10-7 1.22×10-9 1.25×10-8 V! P9 [' T' F% Q6 p7 H Var(et)0 b' z" Y; ^$ z( X( s B 0.999 0.991 0.77288 U5 C1 {8 J4 Q5 F7 @9 o3 X8 i g, E 0.768/ m8 ^, P% Z% L/ x+ f2 J( k: |; [ a1 0.605! Z4 N2 B$ A5 ~$ y7 `0 m3 ?1 S) i 0.764 0.9171 l: E- P: W0 }1 y 0.9326 w6 M- s7 ]9 g. Z( g% d a2+ x. l% ], f( l% b9 l& N7 T -0.257 -0.458: P! T; d$ z- b% Y -0.62 H9 o$ _0 a+ O0 G9 q: B a3 0.126( H7 U& n4 M" p! B 0.344) @5 X! g0 f- j& g$ P4 u R3 v a4 -0.161% z7 Q& A- k! S9 P& [% j 图1中的虚线为趋势、周期分量的乘积即TC序列,它已消除了原序列(实线)中的季节和不规 43 T. _# B7 P; f8 d7 ^: [9 m 则因素的影响,揭示了该指标的中长期变动趋势,由此可准确分析和预测消费品市场的发展态势。. T" N) U9 Y5 l& N- } {: G 图2显示,消费品零售额的季节性波动很规则,各年几乎相同。年底(12月份)与年初(1月)的季节性影响分别达到当期趋势分量的23.2%和7%,而7、8两个月为消费淡季,季节因素分别为当期趋势的-7.3%和-7.5%,其余各月的季节性变动不十分明显,其值均接近1。 图3显示,不规则因素的分解较为合理,其值围绕着均值1做无规律的扰动。 5001000150020002500300019901992199419961998图1 消费品零售额 (实线)及其趋势循环分量TC(虚线) 0.80.911.11.21.319901992199419961998图2 消费品零售额 的季节分量S 0.9511.0519901992199419961998图3 消费品零售额的不规则分量I9 ?3 q1 t1 m$ Y& @. G1 B" k! X- k& q (二)与X-11的比较研究 下面将利用结构时间序列模型进行季节调整的结果与流行的X-11方法加以比较研究,以进一步分析其性能。由于X-11只能将原序列分解为趋势循环项TC、季节项S和不规则项I三部分,不能将周期项单独分离出来,因此下面重点考察用这两种方法分解出的TC序列和S序列的变动情况。! @! d+ S2 ^7 b7 }, u( n8 y 对计算结果的对比分析表明,从总体上看,结构时间序列模型对社会消费品零售总额的分解结$ ]& I$ z" R/ } _% { 5 果与X-11很接近,没有大的差异。 u/ |3 ? q3 ]0 _7 ] 我们知道,季节调整过程中存在的一个主要问题是调整结果的暂定性,即当获得新的数据后进行季节调整的结果与根据原有数据的调整结果会有所差别,这种情况在序列的尾端表现尤为明显,故原来的调整有暂定性或暂时性。显然,新的调整结果与原先调整的结果愈接近,则修正值愈小,季节调整的性能(稳定性)愈好。 为了比较结构时间序列模型与X-11的稳定性,采用这两种方法对截止到1996年2月、1998年2月和1999年2月的不同长度消费品零售总额序列进行季节调整,考察在数据增加3年和增加1年的情况下TC与S序列的修正情况,结果见表2。表中的ATi、ASi分别表示趋势TC和季节因素S在增加i年数据后的修正量绝对值总和,其中括号中的数值为序列最后一年的修正量之和。 表2 社会消费品零售总额季节调整结果的比较! |" i% }* q6 l. c+ q. }2 U# u 调整方法 AT1 AT3 AS1 AS38 ^5 f4 g9 }, T: e" ^, r 结构时间+ v4 w+ c, k7 S. u 序列模型 189.40 (34.114), i8 g- F1 U/ q x" N& [! g# f 337.05 (88.328)( |! K s* b8 } ] 0.2299 (0.0281)! U4 Z1 o E" R `2 K 0.4789- {. ?/ o1 Z9 N (0.0774) j% x! D2 D2 d X-119 u. [; p8 l3 B/ k5 Z; G2 w8 u 季节调整/ T! m5 L- f/ v! I i$ s8 L7 u 291.35 (101.50) 433.30: d- F; V- n6 I6 D, G (205.41)3 Z. C, q! M f7 J% f; N" @) c 0.31539 W1 M% l) U7 ^& W$ n (0.0714) 0.4987 (0.1190) 从表2的结果比较中可以看出,在所考考查的4个项目中,结构时间序列模型产生的修正值均小于X-11的修正值。其中,在趋势项TC上的这种差别更为明显,尤其是对原序列最后一年的修正量差别较大,此时X-11与结构时间序列模型的修正量之比最高达3倍,最低也有2.3倍。 此外,对工业总产值等景气指标的对比分析,也得到了类似的结果。 z1 e( s+ \9 Y8 @4 m' p. ~ 由此表明,在季节调整的稳定性(尤其是在序列末端的稳定性)方面,通常情况下,结构时间序列模型方法比X-11方法的性能要好。6 S+ s7 Z# J) B/ E, i1 c 四、结构时间序列模型在预测中的应用 对经济时间序列建立状态空间形式的结构时间序列模型,不但可用于经济变量的分解和季节调整,还可直接借助建立的模型,利用卡尔曼滤波对序列所含的趋势、周期和季节分量进行外推,从而实现对原序列本身的预测。 下面仍以社会消费品零售额为例,分析结构时间序列模型的预测性能。为此,选取这个序列从1990年1月至1998年2月的数据,利用(11)式建立适当的状态空间模型。与前面相同,经过模型选择取p=1。利用估计出的模型对分解出的趋势T、周期C和季节因素S各外推1年,再将这些外推值对应相乘,作为原序列的预测值,然后将预测值与实际观测值相比较以计算相对误差,计算结果见表3。 表3 月度社会消费品零售额预测值与相对误差 预测时间- s8 S9 M1 C& N9 W; D- K 1998.3 1998.4 1998.5 1998.6) D% B5 N) ?. U8 ? 1998.72 \% f; e: R+ S0 u8 i2 L" \ 1998.8 实际值 2279.7 2252.7 2265.2 2326.0 2286.1 2314.61 `$ E) I. ]' l- i) m# x" G7 d 预测值 2306.70 B* u9 g3 E f# { 2264.5 ~( f3 I% }8 E) s 2281.7 2328.5 2239.92 O9 ~1 v2 ^: n, D6 N8 }$ i 2246.9 相对误差 1.18% 0.52%0 t/ j8 v& ^6 _2 r2 [1 J" F 0.73% 0.11%" d- S% H. I* a1 w- { 2.02% 2.92%# L5 W1 O: J& u/ w8 A) H% c( } 预测时间 1998.9 1998.10# s; W# ^- [! J( P# r4 @& T F" M 1998.11 1998.12 1999.1 1999.2/ }' H3 d) c8 }% V v9 V' f 实际值 2443.1* a* A; x8 o% f, p. M 2536.0' J; v# U0 h9 D' U* D; B9 f 2652.28 I+ }* l) E6 S# C 3131.4& E3 T3 d! B5 U: q- `5 e6 X% z3 {* ]* u 2662.1. w! q1 e# o- C. j8 z7 V 2538.4 预测值 2409.3 2448.35 ~( T7 T3 C+ Z. N 2549.2 3036.7 2670.6 2519.92 f$ D) P* @" |( J- U 相对误差 1.39% 3.46% 3.88%5 N& N8 _7 g8 J. O; N9 d 3.02%2 S1 f1 v& |. N( q3 E. Q 0.32%% @3 ]& ~1 m b! J2 n% |1 l 0.73% 从表中可以看出,除1998年10月和11月份的预测值稍差外,其余各月的预测误差都在3% 以内,外推一年的平均预测相对误差为1.69%。从总体上看,结果是相当令人满意的。) ^( W' Y* ?" l9 @4 ^( E 另外,我们还对工业总产值等景气指标进行了实际预测和检验,外推一年的平均相对预测误差均在3% 以内。可见,结构时间序列模型具有较好的短期预测效果,是一种性能可靠的预测方法。 6 五、结论" `$ V% S) F: }* X 综合以上分析可以看出,利用结构时间序列模型进行季节调整和预测,不但具有较坚实的统计理论基础,而且取得了很好的实际应用结果,为进一步探索和提高经济指标季节调整和预测的准确性提供了一种新的有效工具。8 c) d3 D( k" ^, n 参考文献 1.董文泉等,1998,《经济周期波动的分析和预测方法》,吉林大学出版社。 2.顾 岚 ,1994,《时间序列分析在经济中的应用》,中国统计出版社。 3.Akaike,H. et al.,1985,TIMSAC-84 Part 1,Computer Science Monographs No.24. ?" H3 D- ~8 q& w. |; z 4.Harvey,A.,1989, Forecasting,Structural Time Series and the Kalman Filter, Cambridge Univ. Press. 英文标题:- ]: C; o$ y, I6 E4 |( B# z9 Z1 v Research on Structural Time Series Models of Seasonal Adjustment and Forecasting
| 欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) | Powered by Discuz! X2.5 |