QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2418|回复: 0
打印 上一主题 下一主题

python实现 ARIMA 模型 及逐行解释

[复制链接]
字体大小: 正常 放大

1189

主题

4

听众

2934

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-3-20 10:01 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
ARIMA(Autoregressive Integrated Moving Average)模型是一种常用的时间序列分析方法,用于对时间序列数据建模和预测。它通过结合自回归(AR)和滑动平均(MA)模型的特性,并对序列进行差分(Integration,即I)来建立模型。: T6 ^( c. N! S0 r1 V% g9 L
ARIMA模型的三个主要参数是p、d和q,分别对应于自回归、差分和滑动平均的阶数。3 f- J' G9 s8 S) R4 f# J1 |
7 U  u9 n9 D- Z  C( J1 B/ [
1.自回归(AR):自回归部分使用先前时间点的观测值来预测当前值。p参数表示自回归的阶数,即使用多少个先前时间点的值作为预测输入。- ^  I4 s$ ]) X0 z) @# c# R5 M. y
2.差分(I):差分是对时间序列进行一阶或多阶的差分操作,可以消除序列的非平稳性。d参数表示差分的阶数,默认为1阶差分。. X2 r9 n( N1 [4 X/ c4 j6 x
3.滑动平均(MA):滑动平均部分使用先前的误差值来预测当前值。q参数表示滑动平均的阶数,即使用多少个先前的误差值作为预测输入。* F( W$ M: h) g
, p' M" m( C: p: F; A4 G4 D) q6 @
ARIMA模型的一般表示形式为ARIMA(p, d, q),其中p、d和q是非负整数。它可以很好地处理具有线性趋势和季节性的时间序列数据。' e! |4 l- J( Q% M7 O3 B

0 h1 j, o( n" }& |" Y+ Z$ H- M/ l/ V9 d9 y; c9 T3 A
4.确定时间序列数据的平稳性,如平稳性检验、观察序列的趋势和季节性等。
2 j2 h5 s% ]; J5.如果时间序列不平稳,进行差分操作以实现平稳性。
+ q% E% ^. b/ {) S! a, `/ C+ K  ~6.通过观察ACF和PACF图来确定p和q的合适取值范围。- t4 `7 }$ l. W
7.根据AIC等准则,以不同的p、d、q值建立多个ARIMA模型。
; p8 a4 w* ?3 z0 @9 V4 r8.对每个模型进行参数估计和模型拟合。
/ b& O1 }4 e- @" \& \6 x  A9.使用拟合的模型进行预测,并对模型的拟合效果进行评估。  e0 O6 b0 [  e) K0 K( e5 d

8 F4 {8 }3 G: X8 l4 k9 v7 V' AARIMA模型是时间序列分析领域中常用的模型之一,它可以用于预测未来趋势、季节性和周期性等时间序列数据的变化。在实际应用中,ARIMA模型可以被用于经济预测、股票市场分析、天气预测等各种领域。) r0 y6 L; L% H: N* r# \
希望这个介绍对你有帮助。如果你还有任何问题,请随时提问。, t6 `# I- n9 B; e/ k, `
import numpy as np
& i  K. [- @: u* I. Bimport pandas as pd
8 _1 M& w1 Y! R, e6 Zfrom statsmodels.tsa.arima_model import ARIMA
+ [  B4 M8 o8 Qfrom statsmodels.graphics.tsaplots import plot_acf, plot_pacf* H' _2 O! ]7 D( \5 s6 x6 {. z5 o6 ^
import matplotlib.pyplot as plt4 f* ^2 y* c: [# S) p8 F
& q* u0 |- W% C8 L1 L1 y
这几行代码导入了所需的库,包括NumPy(用于数值计算)、Pandas(用于数据处理和分析)、statsmodels库中的ARIMA模型类和绘制时间序列图的函数,以及matplotlib用于绘图。
) G1 N) X7 l* _5 B0 n: y5 i( S# X( Odf = pd.DataFrame({. x' j1 C- _" q6 T# v8 ]
    'year': [i for i in range(1980, 2011)],
/ q, f  O- A8 @/ y" Y' J4 F* G    'val': [0.82989428, 0.85951092, 0.87668916, 0.86670716, 0.932052,% \2 h$ ?( ~: w( t/ C8 w
            1.04826364, 1.3111932, 1.63756228, 2.0641074, 1.91268276,
0 E8 d. Y# a- I; {. H( t" J; s            2.03544572, 2.17721128, 2.38968344, 2.75059208, 3.0906664,
9 a( A% I& l* Y0 E            3.42664028, 3.83064908, 3.97190864, 3.83160036, 4.143101,
  f2 B: W/ G( o3 _, c            4.566551, 4.47541, 4.462796, 4.384829, 4.796861,
6 e. W  }9 I2 F& ~            5.046211, 5.098759, 5.196519, 5.166843, 5.174744,
! \) z" ]  b# q: G% b4 ]            5.440894],
8 z: t( [& s2 N1 v/ U})4 l3 i# J( S8 r4 \

# B; |% S) E' c8 B, v, T这段代码定义了一个名为df的Pandas DataFrame,其中包含了两列数据:'year'和'val'。'year'列包含了从1980年到2010年的年份数据,'val'列包含了与每个年份对应的值。6 }, p' d8 k4 }' r" n1 ~
df['val_diff1'] = df['val'].diff()
1 p8 |* d' i* `) z" T/ |plt.plot(df['year'], df['val'], label='origin'): s$ Q' C3 w) c( W5 {( |& j
plt.plot(df['year'], df['val_diff1'], label='diff1')3 O' t9 H/ {9 @  E. l$ D
plt.legend()
3 G" J! O$ e( W- M% n  B  ~2 l* f# `1 H% `5 u7 O8 ^! k
这段代码将计算'val'列的一阶差分,并将结果存储在一个新的'valdiff1'列中。然后使用matplotlib绘制了两条线:一条是原始'val'列的线,另一条是差分后的'valdiff1'列的线。plt.legend()函数用于显示图例。
, X$ U. Q* W2 |6 e- c& tplot_acf(df['val_diff1'][1:])8 e" S7 Q1 @$ B% V/ n

) Z0 k1 A) |3 \这行代码使用plot_acf函数绘制了一阶差分后的序列('val_diff1'列)的自相关函数(ACF)图。ACF图用于展示序列在不同滞后阶数的相关性。
  _" F, M& v/ E4 e: w+ E9 H) ]1 \7 Dplot_pacf(df['val_diff1'][1:], lags=14)
  m/ A% U8 x, G0 z1 M: g2 M, X" @* L
这行代码使用plot_pacf函数绘制了一阶差分后的序列('val_diff1'列)的偏自相关函数(PACF)图。PACF图用于展示序列在不同滞后阶数的偏相关性,同时指定了lags=14参数,表示只展示14个滞后阶数的PACF值。
6 K9 H+ ?( \3 y4 l2 k% Estr_list = [], y* T( u, V. d& e  @5 h5 \& _
for p in range(1, 4):* W6 d: r/ h9 [( Q! T
    for q in range(0, 4):, o' \+ N6 N. w& L( N$ X
        model = ARIMA(df['val'], order=(p, 1, q)); b. G& A+ j7 m+ }
        res = model.fit(disp=0)
1 `+ I0 d4 C" w3 n! ]' n        str_list.append('p = {}, q = {}, aic = {}'.format(p, q, res.aic))3 s& W* [: i- f( n
for each in str_list:3 h  e3 g, D$ k3 W6 g4 m. ?
    print(each)
4 I. j; v* s3 ]7 q4 U
8 @) k, M  v( J  A! z0 [8 o这段代码使用嵌套的for循环,遍历p和q的取值范围,分别为1到3和0到3。在每次循环中,创建了一个ARIMA模型对象,并将p、1(表示一阶差分)、q作为参数传递给order参数。然后使用拟合方法(fit)将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。同时,计算并记录了模型的AIC值,并将其添加到字符串列表str_list中。最后,使用循环打印出每个p和q值对应的模型的AIC值。
1 o$ E: U2 V, y4 T; Y; y5 ]model = ARIMA(df['val'], order=(2, 1, 0))
' F+ j$ q. Q, G2 lres = model.fit(disp=0)
" [: e1 X! W" X  W4 x, I! ~9 Z, Fres.summary()- N% A/ _9 F; A3 v# o! P% j8 Q

( Q% f) w3 }4 M% O8 h+ i这部分代码创建了一个ARIMA模型对象,使用p=2、d=1(一阶差分)、q=0来进行参数配置。然后利用拟合方法将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。接下来,调用summary()方法打印出拟合后的模型的详细摘要信息,包括模型系数、标准误差、p值等。0 @2 k% s1 [8 _6 _' r
res.plot_predict(end=40)
1 Q- k8 W9 q4 e! N3 L* F- `6 S4 p! W5 O- l; u, e* X! E1 }
这行代码使用拟合后的模型(res)的plot_predict方法生成了一个预测图表。指定了end=40参数,表示要预测40个时间点。这个图表显示了原始数据和模型对未来值的预测。
- l3 O% C% O4 C& V+ p! o3 W0 l1 U. L希望这些解释可以帮助你理解代码的每一行。如果还有进一步的问题,请随时提问。
  t3 D  Z. T4 ~* J# s4 G8 S) R4 |1 N* x
! }  y: L  d# T- s* N9 U
5 X% I8 ?8 T7 N9 Z. F/ r% i$ Y* j) p

24.arima.py

1.51 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-6-15 03:34 , Processed in 0.433979 second(s), 54 queries .

回顶部