QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2416|回复: 0
打印 上一主题 下一主题

python实现 ARIMA 模型 及逐行解释

[复制链接]
字体大小: 正常 放大

1189

主题

4

听众

2934

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-3-20 10:01 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
ARIMA(Autoregressive Integrated Moving Average)模型是一种常用的时间序列分析方法,用于对时间序列数据建模和预测。它通过结合自回归(AR)和滑动平均(MA)模型的特性,并对序列进行差分(Integration,即I)来建立模型。
. d- h+ A. `8 U& ?1 d# tARIMA模型的三个主要参数是p、d和q,分别对应于自回归、差分和滑动平均的阶数。
, T& A# F1 k1 ?2 N% Y+ c- k* r
& L& b3 L- a. Q/ _1.自回归(AR):自回归部分使用先前时间点的观测值来预测当前值。p参数表示自回归的阶数,即使用多少个先前时间点的值作为预测输入。* Q+ u5 T% o" T3 `; o
2.差分(I):差分是对时间序列进行一阶或多阶的差分操作,可以消除序列的非平稳性。d参数表示差分的阶数,默认为1阶差分。
; ?# @7 a! U9 o, e" R" [2 R3.滑动平均(MA):滑动平均部分使用先前的误差值来预测当前值。q参数表示滑动平均的阶数,即使用多少个先前的误差值作为预测输入。
: I4 T. l8 d2 v
/ D; d8 O% S% \, Y# Q% |* oARIMA模型的一般表示形式为ARIMA(p, d, q),其中p、d和q是非负整数。它可以很好地处理具有线性趋势和季节性的时间序列数据。
7 n3 i. ~5 Z8 x$ Q+ a0 U- h  F- R+ j
+ w$ ]6 {8 A) c" b( Q1 P
4.确定时间序列数据的平稳性,如平稳性检验、观察序列的趋势和季节性等。) ~2 O8 W# G2 n0 d2 g  `2 h4 j( K
5.如果时间序列不平稳,进行差分操作以实现平稳性。. z2 k! ]1 V" J3 C3 A2 N! N
6.通过观察ACF和PACF图来确定p和q的合适取值范围。- p! l# m2 N* t) V& k% X5 y8 {$ E5 L
7.根据AIC等准则,以不同的p、d、q值建立多个ARIMA模型。6 ?. k- ~9 Y3 X9 N0 `0 C
8.对每个模型进行参数估计和模型拟合。
! A  ~. V  c3 h8 C0 y. B- w9.使用拟合的模型进行预测,并对模型的拟合效果进行评估。
( M1 y7 {" M+ j. B5 L+ E) X2 J1 p1 D- p% v/ r8 \( I
ARIMA模型是时间序列分析领域中常用的模型之一,它可以用于预测未来趋势、季节性和周期性等时间序列数据的变化。在实际应用中,ARIMA模型可以被用于经济预测、股票市场分析、天气预测等各种领域。" T: {4 L9 f% @8 g$ P
希望这个介绍对你有帮助。如果你还有任何问题,请随时提问。
" s9 c- @. l  S7 @import numpy as np# q8 w1 h  g1 y! M/ ?+ j" s) e, Z
import pandas as pd5 a7 T- i4 \+ Z
from statsmodels.tsa.arima_model import ARIMA' [7 G4 K0 u" h, ]
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf' i  g- Q* g; @' W
import matplotlib.pyplot as plt7 F* x# ?& z( o5 e& z- l

8 e2 j* R+ c- h5 f这几行代码导入了所需的库,包括NumPy(用于数值计算)、Pandas(用于数据处理和分析)、statsmodels库中的ARIMA模型类和绘制时间序列图的函数,以及matplotlib用于绘图。
# }( W  y4 P) Fdf = pd.DataFrame({# r5 q: q& @1 Q" ~$ \6 H
    'year': [i for i in range(1980, 2011)],' |2 D  W) M" k) ?
    'val': [0.82989428, 0.85951092, 0.87668916, 0.86670716, 0.932052,
$ i5 w4 O% f: q% R  t+ H" A            1.04826364, 1.3111932, 1.63756228, 2.0641074, 1.91268276,2 c( ]: l; x1 [0 a/ @/ s
            2.03544572, 2.17721128, 2.38968344, 2.75059208, 3.0906664,
/ e+ Y8 Z9 L8 |            3.42664028, 3.83064908, 3.97190864, 3.83160036, 4.143101,
8 a: a9 r4 q5 Z: g* v            4.566551, 4.47541, 4.462796, 4.384829, 4.796861,
" G$ j$ @2 @0 a            5.046211, 5.098759, 5.196519, 5.166843, 5.174744,; K9 h( f+ B& ?" U4 w1 H
            5.440894],/ t( A  e4 O5 `, S" Q. Y
})7 P. X) u# c7 C- v3 I

8 t3 Y, T' \4 ^( C这段代码定义了一个名为df的Pandas DataFrame,其中包含了两列数据:'year'和'val'。'year'列包含了从1980年到2010年的年份数据,'val'列包含了与每个年份对应的值。
" z1 [. A3 c! g7 U! i# m4 A  Y; o2 sdf['val_diff1'] = df['val'].diff()
+ x- F9 g9 B  h9 q) Uplt.plot(df['year'], df['val'], label='origin')
: E* v1 F% L/ o, S) Q% ]0 `plt.plot(df['year'], df['val_diff1'], label='diff1')2 E3 O$ I. W6 Q2 W% }8 D
plt.legend(): u0 i( y, z% x% x5 i2 _

5 e& K/ F- s( m! C这段代码将计算'val'列的一阶差分,并将结果存储在一个新的'valdiff1'列中。然后使用matplotlib绘制了两条线:一条是原始'val'列的线,另一条是差分后的'valdiff1'列的线。plt.legend()函数用于显示图例。
, `8 G2 c4 k9 ~2 R0 N6 I5 k  }plot_acf(df['val_diff1'][1:])
% r# `8 _5 w  f- i) X3 ?
5 v+ h' }! e/ X. ~这行代码使用plot_acf函数绘制了一阶差分后的序列('val_diff1'列)的自相关函数(ACF)图。ACF图用于展示序列在不同滞后阶数的相关性。
9 H, r# k9 \1 e/ g5 ~# gplot_pacf(df['val_diff1'][1:], lags=14)! Y& E$ r  Y, u" m1 c5 E

. |! W, ]& P. c' t. C0 t7 |# H这行代码使用plot_pacf函数绘制了一阶差分后的序列('val_diff1'列)的偏自相关函数(PACF)图。PACF图用于展示序列在不同滞后阶数的偏相关性,同时指定了lags=14参数,表示只展示14个滞后阶数的PACF值。
* b! `. C$ P+ G9 D, [( fstr_list = []: s" o2 N# f9 u. X
for p in range(1, 4):
7 U$ Y( r) J6 C. g9 v3 i" t    for q in range(0, 4):+ r, f4 l6 }, x6 C0 s
        model = ARIMA(df['val'], order=(p, 1, q))
0 Y7 s$ @# A+ v2 T3 i1 p        res = model.fit(disp=0)! C! S( X3 E9 X! `2 s3 O# \: ~' ]) e
        str_list.append('p = {}, q = {}, aic = {}'.format(p, q, res.aic))
7 R9 Z- ?7 V1 K# ~for each in str_list:9 L: d# M. _# s  C, E
    print(each)
. X# z( D! ?7 h% j4 t
1 m6 i+ ~) D. T* k这段代码使用嵌套的for循环,遍历p和q的取值范围,分别为1到3和0到3。在每次循环中,创建了一个ARIMA模型对象,并将p、1(表示一阶差分)、q作为参数传递给order参数。然后使用拟合方法(fit)将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。同时,计算并记录了模型的AIC值,并将其添加到字符串列表str_list中。最后,使用循环打印出每个p和q值对应的模型的AIC值。& {1 P$ g1 G  l; u0 k& G+ X5 `
model = ARIMA(df['val'], order=(2, 1, 0))1 p! ^4 O3 [% A. d) F6 P
res = model.fit(disp=0)& K" J, u/ Z; N, K8 ^8 i; ?2 j! U
res.summary(). G" w9 l. C  c' O! H, u% @  B6 j7 F2 M
5 K/ A4 W7 M# T$ U( O0 u
这部分代码创建了一个ARIMA模型对象,使用p=2、d=1(一阶差分)、q=0来进行参数配置。然后利用拟合方法将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。接下来,调用summary()方法打印出拟合后的模型的详细摘要信息,包括模型系数、标准误差、p值等。
3 b8 j+ Z' G! p& T3 K% B6 `4 @res.plot_predict(end=40)  t7 h& h( V6 k$ U4 w

/ R  i( B- k- j这行代码使用拟合后的模型(res)的plot_predict方法生成了一个预测图表。指定了end=40参数,表示要预测40个时间点。这个图表显示了原始数据和模型对未来值的预测。' ]7 }: r' Z8 Q
希望这些解释可以帮助你理解代码的每一行。如果还有进一步的问题,请随时提问。
8 K' C1 G) h* x0 ]
% a  Q0 e+ s- F. E
: f3 Z( \" ^' Q* ^! p% Z$ _- ?

24.arima.py

1.51 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-6-15 00:30 , Processed in 0.399433 second(s), 55 queries .

回顶部