时间序列简介
时间序列 是指将同一统计指标的数值按其先后发生的时间顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。
6 _+ [% |6 z# n4 v
常用的时间序列模型
常用的时间序列模型有四种:自回归模型 AR(p)、移动平均模型 MA(q)、自回归移动平均模型 ARMA(p,q)、自回归差分移动平均模型 ARIMA(p,d,q), 可以说前三种都是 ARIMA(p,d,q)模型的特殊形式。模型的具体方程可以查找相关的专业书籍及网上的资料。
/ g1 j, r& G. ~+ e7 r0 b% Y6 E
时间序列建模基本步骤
· 获取被观测系统时间序列数据;
· 对数据绘图,观测是否为平稳时间序列;对于非平稳时间序列要先进行d阶差分运算,化为平稳时间序列;
· 经过第二步处理,已经得到平稳时间序列。要对平稳时间序列分别求得其自相关系数ACF 和偏自相关系数PACF ,通过对自相关图和偏自相关图的分析,得到最佳的阶层 p 和阶数 q
· 由以上得到的d、q、p ,得到ARIMA模型。然后开始对得到的模型进行模型检验。
自回归模型的限制 1、自回归模型是用自身的数据进行预测 2、必须具有平稳性 3、必须具有相关性,如果自相关系数(φi)小于0.5,则不宜采用 4、自回归只适用于预测与自身前期相关的现象
; q" C% ^/ z' f% n! O2 r$ ?' wARIMA
ARIMA模型的参数定义如下:
· p:模型中包含的滞后观察数,也称为滞后顺序。
· d:原始观测值的差异次数,也称为差分程度。
· q:移动平均窗口的大小,也称为移动平均值的顺序。
/ \% Y$ R) Y' R
1️⃣平稳性检验
平稳:就是围绕着一个常数上下波动且波动范围有限,即有常数均值和常数方差。如果有明显的趋势或周期性,那它通常不是平稳序列。一般有三种方法:
(1)直接画出时间序列的趋势图,看趋势判断。
(2)画自相关和偏自相关图:平稳的序列的自相关图(Autocorrelation)和偏相关图(Partial Correlation)要么拖尾,要么是截尾。
(3)单位根检验ADF检验:检验序列中是否存在单位根,如果存在单位根就是非平稳时间序列。
ADF检验全称是 Augmented Dickey-Fuller test,顾名思义,ADF是 Dickey-Fuller检验的增广形式。DF检验只能应用于一阶情况,当序列存在高阶的滞后相关时,可以使用ADF检验,所以说ADF是对DF检验的扩展。
ADF数值都比这些标准值大。。说明接受原假设(ADF原假设是存在单位根) 所以存在单位根 原数列不平稳。。做差分
ti
-3.52276小于置信度区间1%的 -3.66143 ,拒绝原假设(有单位根),所以一阶差分后平稳了
' j5 d2 ?6 a% S Z) N. N
2️⃣确定ARMA的阶数
根据时间序列的识别规则,采用 ACF 图、PAC 图,AIC 准则(赤道信息量准则)和 BIC 准则(贝叶斯准则)相结合的方式来确定 ARMA 模型的阶数, 应当选取 AIC 和 BIC 值达到最小的那一组为理想阶数。
" z6 C# E0 m5 ]
(1)利用自相关图和偏自相关图
2 e$ w$ k* e' [5 G' l(2)利用AIC、BIC自动定阶: q) S6 c) g- K6 z
3️⃣建立ARMA模型并预测
5 P/ e: m* w% o/ F1 p8 A9 L4️⃣对残差进行ADF检验
5 m$ n2 q5 P; i1 k! f, c( g3 w# E$ f% U4 d) ?4 Y
7 K8 P7 x8 j9 c) R: ~7 f0 E
[backcolor=var(--color-canvas-subtle)]
+ ?+ o) q5 Z% z. N1 X$ J9 r
$ L* U! z* e" k' M7 q