- 在线时间
- 478 小时
- 最后登录
- 2026-4-9
- 注册时间
- 2023-7-11
- 听众数
- 4
- 收听数
- 0
- 能力
- 0 分
- 体力
- 7788 点
- 威望
- 0 点
- 阅读权限
- 255
- 积分
- 2922
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1171
- 主题
- 1186
- 精华
- 0
- 分享
- 0
- 好友
- 1
该用户从未签到
 |
ARIMA(Autoregressive Integrated Moving Average)模型是一种常用的时间序列分析方法,用于对时间序列数据建模和预测。它通过结合自回归(AR)和滑动平均(MA)模型的特性,并对序列进行差分(Integration,即I)来建立模型。* ~6 [4 q" k/ P, Y2 J
ARIMA模型的三个主要参数是p、d和q,分别对应于自回归、差分和滑动平均的阶数。
; q. N& ^3 F. k+ A9 [, Y
* o! k+ W$ D& _/ `! |1.自回归(AR):自回归部分使用先前时间点的观测值来预测当前值。p参数表示自回归的阶数,即使用多少个先前时间点的值作为预测输入。
! ]; _ y) X ~) g4 ^( L2.差分(I):差分是对时间序列进行一阶或多阶的差分操作,可以消除序列的非平稳性。d参数表示差分的阶数,默认为1阶差分。. C& E8 y9 Y) X z# Q% j- c
3.滑动平均(MA):滑动平均部分使用先前的误差值来预测当前值。q参数表示滑动平均的阶数,即使用多少个先前的误差值作为预测输入。+ w! z _7 L1 a! [' T
" c4 _% ]- f# c* c" l2 {
ARIMA模型的一般表示形式为ARIMA(p, d, q),其中p、d和q是非负整数。它可以很好地处理具有线性趋势和季节性的时间序列数据。
8 ?% ]: V8 o, b0 WARIMA模型的建立包括以下步骤:& u4 K5 e2 s1 ^9 X: ]
- `, P/ i: ?3 [! n: z% |4.确定时间序列数据的平稳性,如平稳性检验、观察序列的趋势和季节性等。6 e- v; `: P# R$ R! V
5.如果时间序列不平稳,进行差分操作以实现平稳性。
4 D: `2 ~9 \! G6.通过观察ACF和PACF图来确定p和q的合适取值范围。
8 L5 H0 G' n0 T) l3 {7.根据AIC等准则,以不同的p、d、q值建立多个ARIMA模型。
+ x7 X: [" |$ H5 [ ]3 r8.对每个模型进行参数估计和模型拟合。0 _! _. I5 W, x! e
9.使用拟合的模型进行预测,并对模型的拟合效果进行评估。
1 [' M" U' [$ i& j7 U8 c- }% B5 P5 U6 H9 n8 L, E$ Z
ARIMA模型是时间序列分析领域中常用的模型之一,它可以用于预测未来趋势、季节性和周期性等时间序列数据的变化。在实际应用中,ARIMA模型可以被用于经济预测、股票市场分析、天气预测等各种领域。) j! }% s; l, ]4 B6 q& b
' w0 B. q8 S; W/ a0 z' x
# 导入所需的库
% j; d5 ^2 \" r" A4 X9 Vimport numpy as np
' y O) p) R& ]2 I0 rimport pandas as pd6 Z5 R; t+ _. z2 j" q
import statsmodels.api as sm) q* u) ^6 y- B3 @& |; I% X" c% j
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf$ [, q3 c- `1 c3 x1 t2 o
import matplotlib.pyplot as plt- |, K, z9 \3 |5 r( @
; {' b4 Q* q1 `7 ^; E" t9 n5 {这些是导入需要使用的库,包括NumPy、Pandas、statsmodels和matplotlib。
t; N: m4 `% s' y0 R# 源数据7 |- Q% H7 G5 `- j2 o& q
df = pd.DataFrame({$ {; ~( s& L" s+ }5 G W
'year': [i for i in range(1971, 1991)],& I$ l5 h- f, h5 D& [
'num': [66.6, 68.9, 38, 34.5, 15.5,- {/ C7 c, ~# c3 j2 t
12.6, 27.5, 92.5, 155.4, 154.6,
~ ^4 O- M" F7 M# [ 140.4, 115.9, 66.6, 45.9, 17.9,
5 v, D7 t* |8 B/ r+ U; ~ 3.4, 29.4, 100.2, 157.6, 142.6],
: \" y. w, Y$ d; d0 b}). ?* t! ~9 }, A6 L6 P/ V
6 d/ W) {: o6 l& e. V
这里创建了一个DataFrame df,包含年份和对应的数据值。这个数据将用于建立ARIMA模型。
2 l* `1 }7 Q" r3 u# 画 acf 图: Z7 o- t" G8 s" I9 o
plot_acf(df['num'])% }8 L0 U. c7 ?# [8 \& i; \
( g" Y: o8 i; d2 [- J6 W
这段代码用于画出序列的自相关函数(ACF)图。ACF图可以帮助我们分析时间序列数据的自相关性。4 V! I# f4 ^% m8 j( y
# 画 pacf 图
- ^* V1 d3 c0 V5 _. \% G) Hplot_pacf(df['num'], lags=9)
7 {! s4 L& R N% O
4 ?4 D1 k2 O' Q: k4 K1 W+ E& t. i2 U这段代码用于画出序列的偏自相关函数(PACF)图。PACF图可以帮助我们分析时间序列数据的偏自相关性。0 {3 q% S! Y* _! ]; I) @
# 建立模型,参考 acf、pacf 代入 p、q,观察 aic# `1 T; F5 M) @6 l! R
str_list = []
/ \% X; f. m8 l! K. l( Zfor p in range(1, 6):% D3 S. d9 y! O/ s% S6 Z1 L' T/ w
for q in range(1, 3):
+ l1 `( z3 p. S' W. x model = sm.tsa.ARMA(df['num'], (p, q)).fit()
# y/ z$ x( y7 p& D str_list.append('p = {}, q = {}, aic = {}'.format(p, q, model.aic))+ B) c# t& m* k! n) p
for each in str_list:5 N# {% r9 j& @
print(each)
$ j: M9 Y% h5 g9 e5 _7 H
8 s3 y4 G: a" |& ]. V这段代码用于建立ARIMA模型并观察模型的AIC(赤池信息准则)值。通过对不同(p, q)值的组合进行模型拟合,并输出对应的AIC值,以便选择最优的(p, q)值。7 L7 o! g3 N, I# Q" v/ J; ^. J
# 发现 p=2,q=2 时 aic 最小,取 p=2,q=2( c+ U4 @" t$ i# }2 O4 q4 O
model = sm.tsa.ARMA(df['num'], (2, 2)).fit()
) {' f) D9 N! Tmodel.summary()
* T# w L* e+ G) q' k; d/ m1 ] z" R+ C5 f
根据观察AIC值的结果,选择最优(p, q)值为(2, 2),然后建立ARIMA模型并进行拟合。9 l. X1 y5 g. t V3 v( g
# 预测和画图; m6 I, K: \9 o1 r
plt.plot(df['year'], df['num'])! R# ?. X7 M, C6 Y
plt.scatter(df['year'], df['num'], label='actual')
1 Y2 p9 o* Q4 ]7 s* l: Syear_list = [i for i in range(1971, 2001)]
7 j, D! |6 Z% J6 w2 a: _plt.plot(year_list, model.predict(0, len(year_list)-1))
! Z8 f* [: v6 \plt.scatter(year_list, model.predict(0, len(year_list)-1), label='predict')
, q; e3 p6 F# g4 N) C% H& }plt.legend()
- M4 w; Q; i; n* Y+ L' N
1 C* r- m2 \+ c) p; e5 D8 W这段代码用于使用拟合的模型进行预测,并绘制实际值和预测值的图表。首先画出实际值的曲线,然后画出预测值的曲线,并将预测值的点标记在图上。" J8 G! a# U* i1 p
希望以上解释对你有帮助。如果你还有任何问题,请随时提问。3 _) S5 G% s3 \/ D& b6 V
I; G) M4 {) q) ^- |
: _: w: w" I" I |
zan
|