QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2358|回复: 0
打印 上一主题 下一主题

python实现 ARIMA 模型 及逐行解释

[复制链接]
字体大小: 正常 放大

1186

主题

4

听众

2922

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-3-20 10:01 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
ARIMA(Autoregressive Integrated Moving Average)模型是一种常用的时间序列分析方法,用于对时间序列数据建模和预测。它通过结合自回归(AR)和滑动平均(MA)模型的特性,并对序列进行差分(Integration,即I)来建立模型。% q$ O# |5 S" v' e+ |  l" u. ]# y
ARIMA模型的三个主要参数是p、d和q,分别对应于自回归、差分和滑动平均的阶数。: n# S8 ~* ^. k7 H& n/ V7 {% E

" M' @2 M2 U9 p8 E1.自回归(AR):自回归部分使用先前时间点的观测值来预测当前值。p参数表示自回归的阶数,即使用多少个先前时间点的值作为预测输入。
! `9 M' `3 M" b7 m/ G' m2.差分(I):差分是对时间序列进行一阶或多阶的差分操作,可以消除序列的非平稳性。d参数表示差分的阶数,默认为1阶差分。+ W& }) s+ X/ u4 ?" Q0 I4 Z
3.滑动平均(MA):滑动平均部分使用先前的误差值来预测当前值。q参数表示滑动平均的阶数,即使用多少个先前的误差值作为预测输入。5 U# x, r2 [# o) }2 q& k7 [

8 `: g4 N' F" M+ @- i4 @ARIMA模型的一般表示形式为ARIMA(p, d, q),其中p、d和q是非负整数。它可以很好地处理具有线性趋势和季节性的时间序列数据。$ w# d! l& t( h+ h: a
4 U0 L( q+ v1 r; k. Z- W2 |

4 E9 i0 u2 Y( ^0 o- P9 ?2 w4.确定时间序列数据的平稳性,如平稳性检验、观察序列的趋势和季节性等。
$ [* L1 a0 e, R9 z/ Y( [5.如果时间序列不平稳,进行差分操作以实现平稳性。
% I. A: T# y/ z" W6.通过观察ACF和PACF图来确定p和q的合适取值范围。
7 z) L4 V5 x+ n, v( Z+ t7.根据AIC等准则,以不同的p、d、q值建立多个ARIMA模型。$ W8 z2 G( V- v3 }) z/ A
8.对每个模型进行参数估计和模型拟合。
8 `; c0 w4 f6 B/ O. @9.使用拟合的模型进行预测,并对模型的拟合效果进行评估。
# `3 q, B6 t" A" N- v5 x$ `* N% }) L% V) B2 l. p+ I1 `- s
ARIMA模型是时间序列分析领域中常用的模型之一,它可以用于预测未来趋势、季节性和周期性等时间序列数据的变化。在实际应用中,ARIMA模型可以被用于经济预测、股票市场分析、天气预测等各种领域。
, m4 V5 Y6 l. w5 p* }希望这个介绍对你有帮助。如果你还有任何问题,请随时提问。4 r( ~1 a) N, Y2 e
import numpy as np
: T* h8 |, Q4 U1 E$ N/ i$ Oimport pandas as pd. J( P' r5 m6 j& u3 e: K
from statsmodels.tsa.arima_model import ARIMA0 d9 ~& g8 ^  w" Q, n" a$ q
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
( C; `' r! y: Z0 g% I; V: h  Ximport matplotlib.pyplot as plt/ h/ U/ ]* c7 c3 Q
1 ?: w1 K& Z- a: S
这几行代码导入了所需的库,包括NumPy(用于数值计算)、Pandas(用于数据处理和分析)、statsmodels库中的ARIMA模型类和绘制时间序列图的函数,以及matplotlib用于绘图。$ A. i: D5 S2 y" c7 l8 j% t9 L
df = pd.DataFrame({
+ G( u* F" B  l    'year': [i for i in range(1980, 2011)],
' E& N( f, o7 E5 [" x' d    'val': [0.82989428, 0.85951092, 0.87668916, 0.86670716, 0.932052," B/ x3 x: B9 n. q: u2 d7 K6 h
            1.04826364, 1.3111932, 1.63756228, 2.0641074, 1.91268276,( U0 q* S; s" X' y
            2.03544572, 2.17721128, 2.38968344, 2.75059208, 3.0906664,+ n: f) Z; Q! j) m# Y% Y/ J. [
            3.42664028, 3.83064908, 3.97190864, 3.83160036, 4.143101,, N  p6 l" l  H) ^. Y
            4.566551, 4.47541, 4.462796, 4.384829, 4.796861,& M9 x7 z2 k8 H$ C" L/ r' F5 }
            5.046211, 5.098759, 5.196519, 5.166843, 5.174744,6 F$ y" i& m) g: O7 d$ f( G
            5.440894],1 C4 {* F) t. R) v0 k
}), i- \( G: }" X8 ~( Q; i5 y

: ]% v& l- e5 u3 ?) A7 |/ G0 w这段代码定义了一个名为df的Pandas DataFrame,其中包含了两列数据:'year'和'val'。'year'列包含了从1980年到2010年的年份数据,'val'列包含了与每个年份对应的值。) s2 O1 G: y' e5 \) R7 y
df['val_diff1'] = df['val'].diff(): u/ N7 q2 P$ ?% {% x3 |- L
plt.plot(df['year'], df['val'], label='origin')
& r7 }4 g1 ^9 [1 h+ q; q" \plt.plot(df['year'], df['val_diff1'], label='diff1')
+ c  }) B6 B% J0 ]plt.legend()
. U  O% ^  g+ C  |
/ @; r* C2 i* ~8 y+ O6 C. y这段代码将计算'val'列的一阶差分,并将结果存储在一个新的'valdiff1'列中。然后使用matplotlib绘制了两条线:一条是原始'val'列的线,另一条是差分后的'valdiff1'列的线。plt.legend()函数用于显示图例。0 Y6 \# p8 E# {; ]+ x
plot_acf(df['val_diff1'][1:])
0 w: v0 S8 [+ H: f
0 C3 k4 d  R5 M  d1 E7 z这行代码使用plot_acf函数绘制了一阶差分后的序列('val_diff1'列)的自相关函数(ACF)图。ACF图用于展示序列在不同滞后阶数的相关性。& O% ]+ k6 f6 M# C) g4 _
plot_pacf(df['val_diff1'][1:], lags=14)
/ N% R, I. N  A; D' [/ a. X2 B4 j7 A6 w, H! l
这行代码使用plot_pacf函数绘制了一阶差分后的序列('val_diff1'列)的偏自相关函数(PACF)图。PACF图用于展示序列在不同滞后阶数的偏相关性,同时指定了lags=14参数,表示只展示14个滞后阶数的PACF值。: s8 O3 G+ X* R' N
str_list = []
3 J7 U( q" f. H8 yfor p in range(1, 4):; ]1 j! ~& j' o0 P
    for q in range(0, 4):
# h" z) I+ ^% C) p        model = ARIMA(df['val'], order=(p, 1, q))
& Z/ [0 U* F  e/ h3 Y6 ]/ z$ M2 i        res = model.fit(disp=0)0 r( o5 C, e$ D2 @
        str_list.append('p = {}, q = {}, aic = {}'.format(p, q, res.aic))
% m5 s# e* m% `1 N4 s& _for each in str_list:. v& t. y  l1 ~2 _) B  c
    print(each)3 E6 h. a& D- s6 m$ Q9 s3 _! o* b# J

: \9 G  L/ I7 @这段代码使用嵌套的for循环,遍历p和q的取值范围,分别为1到3和0到3。在每次循环中,创建了一个ARIMA模型对象,并将p、1(表示一阶差分)、q作为参数传递给order参数。然后使用拟合方法(fit)将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。同时,计算并记录了模型的AIC值,并将其添加到字符串列表str_list中。最后,使用循环打印出每个p和q值对应的模型的AIC值。
+ K8 G, m' n8 I* ]8 F9 A: Wmodel = ARIMA(df['val'], order=(2, 1, 0)). |+ U$ p% k7 O: s5 ^! e0 M4 ^& m* c8 ]
res = model.fit(disp=0)
+ a( ]- u, Z; |: }res.summary(); g3 C1 z# ^4 V

" i8 d  r2 d% G, k7 u# Z这部分代码创建了一个ARIMA模型对象,使用p=2、d=1(一阶差分)、q=0来进行参数配置。然后利用拟合方法将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。接下来,调用summary()方法打印出拟合后的模型的详细摘要信息,包括模型系数、标准误差、p值等。7 ]" M! t/ f& K$ t
res.plot_predict(end=40)
8 q6 \) Q7 h- v* E- y& Q
: a7 `* H/ F+ }. I) p6 R这行代码使用拟合后的模型(res)的plot_predict方法生成了一个预测图表。指定了end=40参数,表示要预测40个时间点。这个图表显示了原始数据和模型对未来值的预测。
" B$ q8 }% m$ _, V/ L) M希望这些解释可以帮助你理解代码的每一行。如果还有进一步的问题,请随时提问。' C# ?; S( l4 N9 L. Q2 m: M, M
" [* p. y' ]1 @2 p! j
! v3 b' F- _8 l. a1 }+ l

24.arima.py

1.51 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-4-13 18:53 , Processed in 0.418818 second(s), 55 queries .

回顶部