QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2417|回复: 0
打印 上一主题 下一主题

python实现 ARIMA 模型 及逐行解释

[复制链接]
字体大小: 正常 放大

1189

主题

4

听众

2934

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-3-20 10:01 |只看该作者 |正序浏览
|招呼Ta 关注Ta
ARIMA(Autoregressive Integrated Moving Average)模型是一种常用的时间序列分析方法,用于对时间序列数据建模和预测。它通过结合自回归(AR)和滑动平均(MA)模型的特性,并对序列进行差分(Integration,即I)来建立模型。% A, e1 H; `6 _# s
ARIMA模型的三个主要参数是p、d和q,分别对应于自回归、差分和滑动平均的阶数。
5 c+ ?% N# c& x4 C8 U8 w+ m* M
7 [& D) `, o& I: A1.自回归(AR):自回归部分使用先前时间点的观测值来预测当前值。p参数表示自回归的阶数,即使用多少个先前时间点的值作为预测输入。! B* q" T$ t$ x
2.差分(I):差分是对时间序列进行一阶或多阶的差分操作,可以消除序列的非平稳性。d参数表示差分的阶数,默认为1阶差分。- W  r# r* g2 Q( R* Q+ m+ O
3.滑动平均(MA):滑动平均部分使用先前的误差值来预测当前值。q参数表示滑动平均的阶数,即使用多少个先前的误差值作为预测输入。
1 |8 G: N. _5 J
+ m9 G; i+ r% s" t8 [- \5 S  fARIMA模型的一般表示形式为ARIMA(p, d, q),其中p、d和q是非负整数。它可以很好地处理具有线性趋势和季节性的时间序列数据。
3 U9 H8 y; V0 _" S
) x3 p8 m% j7 E9 Q1 z2 w$ P! V" c' n
4.确定时间序列数据的平稳性,如平稳性检验、观察序列的趋势和季节性等。* W; A! G& `) J/ s$ k: ~; a
5.如果时间序列不平稳,进行差分操作以实现平稳性。
- F& |3 g# T* [& X) A$ Y) s6.通过观察ACF和PACF图来确定p和q的合适取值范围。
; e+ L; A# y" z8 Z* n% B2 g* B$ t  J, Y7.根据AIC等准则,以不同的p、d、q值建立多个ARIMA模型。
+ ~% c) @! C) ]& U2 j8.对每个模型进行参数估计和模型拟合。
4 e1 x& p. R1 [. N) t9.使用拟合的模型进行预测,并对模型的拟合效果进行评估。
% F5 C0 P' R9 y5 a9 m" j; d7 J' R' y7 W8 }
ARIMA模型是时间序列分析领域中常用的模型之一,它可以用于预测未来趋势、季节性和周期性等时间序列数据的变化。在实际应用中,ARIMA模型可以被用于经济预测、股票市场分析、天气预测等各种领域。
% z$ N+ |$ m$ ]' B4 n) ]/ u8 ]# Z希望这个介绍对你有帮助。如果你还有任何问题,请随时提问。
% D: q" @8 T; I# |import numpy as np- @3 [# ], N2 n
import pandas as pd& D2 ?+ ~! s) z9 u" ~8 u6 z( h
from statsmodels.tsa.arima_model import ARIMA
) F! Y9 H7 b- e& q- R* F( c0 M4 hfrom statsmodels.graphics.tsaplots import plot_acf, plot_pacf
) u; Q, }+ @; I9 _, W9 O: l! pimport matplotlib.pyplot as plt# y1 q/ d9 c  j; ]; C
# R* o- N) S' \4 c6 r
这几行代码导入了所需的库,包括NumPy(用于数值计算)、Pandas(用于数据处理和分析)、statsmodels库中的ARIMA模型类和绘制时间序列图的函数,以及matplotlib用于绘图。
- K( [5 i$ f9 @  j0 tdf = pd.DataFrame({
' N! f8 Y$ e* e' n* V$ N4 |    'year': [i for i in range(1980, 2011)],
0 t, W5 ~5 z' i6 u* J$ J    'val': [0.82989428, 0.85951092, 0.87668916, 0.86670716, 0.932052,
4 H& B) H" _8 {3 l            1.04826364, 1.3111932, 1.63756228, 2.0641074, 1.91268276,
1 N8 k+ k0 T% A- q            2.03544572, 2.17721128, 2.38968344, 2.75059208, 3.0906664,
6 W  m0 a/ h8 n- J4 |            3.42664028, 3.83064908, 3.97190864, 3.83160036, 4.143101,
+ M5 L: M" k& M, J. E% `+ j            4.566551, 4.47541, 4.462796, 4.384829, 4.796861,
! S/ A; @" o& W, t8 U0 A0 V            5.046211, 5.098759, 5.196519, 5.166843, 5.174744,- F0 f" w! x: v" ?
            5.440894],
: q" L3 l' r. K/ X* n7 u2 z})
2 R, B  Y, x" Y/ Y. j; z1 i6 R' |/ g. s1 O0 Z
这段代码定义了一个名为df的Pandas DataFrame,其中包含了两列数据:'year'和'val'。'year'列包含了从1980年到2010年的年份数据,'val'列包含了与每个年份对应的值。
* ]3 I7 p( Q0 W  gdf['val_diff1'] = df['val'].diff()
/ [% @' s% I0 bplt.plot(df['year'], df['val'], label='origin')/ Z. m+ ~6 D; N, o$ Z  y  @6 u
plt.plot(df['year'], df['val_diff1'], label='diff1')
0 S0 J- {  `  Y; \) p# cplt.legend(). r/ w0 W) s) k- s& e

0 g& t/ `& T( t: f- E. Z这段代码将计算'val'列的一阶差分,并将结果存储在一个新的'valdiff1'列中。然后使用matplotlib绘制了两条线:一条是原始'val'列的线,另一条是差分后的'valdiff1'列的线。plt.legend()函数用于显示图例。0 G/ S+ S/ R0 K2 p$ C; K5 C! z
plot_acf(df['val_diff1'][1:])
/ d6 t" K% w2 v9 k. e  T4 a+ u& C4 z, F
这行代码使用plot_acf函数绘制了一阶差分后的序列('val_diff1'列)的自相关函数(ACF)图。ACF图用于展示序列在不同滞后阶数的相关性。" r; {0 \, y2 H3 m, j' X: E
plot_pacf(df['val_diff1'][1:], lags=14)
6 Q; ~, Y/ v2 E, A: [; t, C: G8 U8 D
这行代码使用plot_pacf函数绘制了一阶差分后的序列('val_diff1'列)的偏自相关函数(PACF)图。PACF图用于展示序列在不同滞后阶数的偏相关性,同时指定了lags=14参数,表示只展示14个滞后阶数的PACF值。$ F6 Z% ]% ^$ a6 d) }( ~
str_list = []" \8 p8 \/ r  q) I6 N
for p in range(1, 4):
; ?7 @- L9 L1 i8 k4 Y    for q in range(0, 4):
* V8 Q/ F2 z4 D0 r4 e. O        model = ARIMA(df['val'], order=(p, 1, q))" @! j& P) }$ B2 `# ?9 M% v; D
        res = model.fit(disp=0)' T6 C2 J% V! _& i. v$ V% [" M5 h
        str_list.append('p = {}, q = {}, aic = {}'.format(p, q, res.aic))5 Z# [5 a) ?! Z7 N
for each in str_list:3 D% B0 y- F1 r! a# l# J
    print(each)
% |3 [' w, _6 q$ U8 g! f" o% ~  Y0 J; O5 U" i+ b* }( _* ^' U
这段代码使用嵌套的for循环,遍历p和q的取值范围,分别为1到3和0到3。在每次循环中,创建了一个ARIMA模型对象,并将p、1(表示一阶差分)、q作为参数传递给order参数。然后使用拟合方法(fit)将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。同时,计算并记录了模型的AIC值,并将其添加到字符串列表str_list中。最后,使用循环打印出每个p和q值对应的模型的AIC值。
' n( ]7 r$ Y# ?+ c7 ]. ~$ U% k: Qmodel = ARIMA(df['val'], order=(2, 1, 0))1 m0 \% _8 z  N4 E" v
res = model.fit(disp=0)
+ w+ H. ?" Y* h' a) A: Ures.summary()
0 i: B6 T1 D* |! K' C' V/ `4 z* a2 Q* C
这部分代码创建了一个ARIMA模型对象,使用p=2、d=1(一阶差分)、q=0来进行参数配置。然后利用拟合方法将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。接下来,调用summary()方法打印出拟合后的模型的详细摘要信息,包括模型系数、标准误差、p值等。: w% n, C* Y! `- N7 x
res.plot_predict(end=40)
8 k5 a! d$ a7 e$ [
/ h7 D  s0 x) g* P这行代码使用拟合后的模型(res)的plot_predict方法生成了一个预测图表。指定了end=40参数,表示要预测40个时间点。这个图表显示了原始数据和模型对未来值的预测。9 B& f/ g6 g+ O, F( i4 D. X1 h
希望这些解释可以帮助你理解代码的每一行。如果还有进一步的问题,请随时提问。
5 l1 `. X' p3 G6 ?# K/ W4 x1 P( {; q7 ~5 A6 @+ |6 [! s1 q

2 E8 G6 }3 S7 m* P3 P# s; X( B$ I

24.arima.py

1.51 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-6-15 01:55 , Processed in 0.408080 second(s), 55 queries .

回顶部