QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2364|回复: 0
打印 上一主题 下一主题

python实现 ARIMA 模型 及逐行解释

[复制链接]
字体大小: 正常 放大

1186

主题

4

听众

2922

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-3-20 10:01 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
ARIMA(Autoregressive Integrated Moving Average)模型是一种常用的时间序列分析方法,用于对时间序列数据建模和预测。它通过结合自回归(AR)和滑动平均(MA)模型的特性,并对序列进行差分(Integration,即I)来建立模型。( d7 ^) ]3 S9 X/ q
ARIMA模型的三个主要参数是p、d和q,分别对应于自回归、差分和滑动平均的阶数。
: E& `1 D. x5 c& ]5 T1 [* @2 u5 T5 q( |
1.自回归(AR):自回归部分使用先前时间点的观测值来预测当前值。p参数表示自回归的阶数,即使用多少个先前时间点的值作为预测输入。7 K. d9 ?: }6 B. U
2.差分(I):差分是对时间序列进行一阶或多阶的差分操作,可以消除序列的非平稳性。d参数表示差分的阶数,默认为1阶差分。# \5 {" c/ Y4 G2 b. l7 Y
3.滑动平均(MA):滑动平均部分使用先前的误差值来预测当前值。q参数表示滑动平均的阶数,即使用多少个先前的误差值作为预测输入。% d! K9 g1 ]; r* p% s

8 z5 d- T: J8 X5 Q* SARIMA模型的一般表示形式为ARIMA(p, d, q),其中p、d和q是非负整数。它可以很好地处理具有线性趋势和季节性的时间序列数据。* G6 m# U& C$ U- m3 i2 C
3 t( J) Z" Q0 k8 Z
/ e2 ~: i# ]& G6 R
4.确定时间序列数据的平稳性,如平稳性检验、观察序列的趋势和季节性等。
0 J, ~1 v5 s( X9 x* _; X, G+ ^" E& ^5.如果时间序列不平稳,进行差分操作以实现平稳性。" M* r; H) n" r- O8 w5 s- l* [) R
6.通过观察ACF和PACF图来确定p和q的合适取值范围。
0 r6 x' Z% K# u4 L0 Y7 G2 t! J7.根据AIC等准则,以不同的p、d、q值建立多个ARIMA模型。
. u& l1 K! y' ^: ^) L$ L2 S8.对每个模型进行参数估计和模型拟合。2 H5 w! y% b! {
9.使用拟合的模型进行预测,并对模型的拟合效果进行评估。
7 h: ]) V' S- D8 ]$ C5 G
9 H6 }3 n# u5 [) KARIMA模型是时间序列分析领域中常用的模型之一,它可以用于预测未来趋势、季节性和周期性等时间序列数据的变化。在实际应用中,ARIMA模型可以被用于经济预测、股票市场分析、天气预测等各种领域。
) G! G* _% N- C9 r$ W: ?) m! c# N* Z希望这个介绍对你有帮助。如果你还有任何问题,请随时提问。3 ?' j4 G. r& o" f1 c) U# r
import numpy as np* n- `$ h+ t0 S+ p
import pandas as pd
! t- Y% Q* S& ufrom statsmodels.tsa.arima_model import ARIMA2 I5 c$ A1 S* @2 O$ ~
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf5 n7 a* S+ S) N. l
import matplotlib.pyplot as plt
# d* t* x- M( h+ {; x2 s" k  D! C) A2 V& P
这几行代码导入了所需的库,包括NumPy(用于数值计算)、Pandas(用于数据处理和分析)、statsmodels库中的ARIMA模型类和绘制时间序列图的函数,以及matplotlib用于绘图。* @( g! C5 P7 K' h( G
df = pd.DataFrame({
. U/ D3 c# n, }) E    'year': [i for i in range(1980, 2011)],( v5 h1 N3 {) B7 ?- j4 U+ z
    'val': [0.82989428, 0.85951092, 0.87668916, 0.86670716, 0.932052,
; @) L6 y4 ]7 O* U; x6 r) x, _3 K            1.04826364, 1.3111932, 1.63756228, 2.0641074, 1.91268276,; {! k/ v$ H! f  ^; y: i
            2.03544572, 2.17721128, 2.38968344, 2.75059208, 3.0906664,
- e( u7 E- c: B3 r+ p5 B& Z            3.42664028, 3.83064908, 3.97190864, 3.83160036, 4.143101,/ e. [' J# S0 _/ B( u' _
            4.566551, 4.47541, 4.462796, 4.384829, 4.796861,
1 t3 }, A. e4 K" v% w            5.046211, 5.098759, 5.196519, 5.166843, 5.174744,
8 a0 ^, e/ _2 }            5.440894],
3 n, J# R/ D0 u' S/ n2 e2 z})
$ U' S4 q2 h; P( n& V
2 F& w, C+ w% n这段代码定义了一个名为df的Pandas DataFrame,其中包含了两列数据:'year'和'val'。'year'列包含了从1980年到2010年的年份数据,'val'列包含了与每个年份对应的值。
: g; z2 f0 P/ R/ O$ s7 wdf['val_diff1'] = df['val'].diff()4 d1 D7 n8 y% |5 z
plt.plot(df['year'], df['val'], label='origin')
" N) f/ i# h9 ^. Q& mplt.plot(df['year'], df['val_diff1'], label='diff1')
0 K" A! G0 Y4 n& ]- k+ Jplt.legend(). ], t3 b+ R' P4 I0 ]! R. ~

% y2 j! O6 f9 w这段代码将计算'val'列的一阶差分,并将结果存储在一个新的'valdiff1'列中。然后使用matplotlib绘制了两条线:一条是原始'val'列的线,另一条是差分后的'valdiff1'列的线。plt.legend()函数用于显示图例。
) g0 W! @) d( X7 S% aplot_acf(df['val_diff1'][1:])
) Q& B$ U' p1 Y, ]* v; \+ W. l$ A6 J, w0 Y( }  ?
这行代码使用plot_acf函数绘制了一阶差分后的序列('val_diff1'列)的自相关函数(ACF)图。ACF图用于展示序列在不同滞后阶数的相关性。2 O4 F% T" o" _8 o! t
plot_pacf(df['val_diff1'][1:], lags=14)
- b5 L) X; v! n( C9 V: D
& c- W* L$ @6 m, H这行代码使用plot_pacf函数绘制了一阶差分后的序列('val_diff1'列)的偏自相关函数(PACF)图。PACF图用于展示序列在不同滞后阶数的偏相关性,同时指定了lags=14参数,表示只展示14个滞后阶数的PACF值。
& t4 S- m9 [& E8 z. gstr_list = []* c. G$ Z+ P" F7 E' _' t  ~
for p in range(1, 4):
) M& Q8 f/ t+ ]! R: m2 s! m0 w# ~    for q in range(0, 4):
% D6 l/ X3 [" T5 n        model = ARIMA(df['val'], order=(p, 1, q)). R0 Y( ~6 J+ d- o$ s2 D8 T
        res = model.fit(disp=0)
6 h6 l+ k0 j2 ?& o! u# P% y# C        str_list.append('p = {}, q = {}, aic = {}'.format(p, q, res.aic))! @6 w+ @3 Z: {! J$ L0 [
for each in str_list:
& C8 \9 R+ L* c, T1 ^" o$ A    print(each)# j0 f! }. j+ I  V: X* H
7 Y& s* U) H$ ~, U. k6 H
这段代码使用嵌套的for循环,遍历p和q的取值范围,分别为1到3和0到3。在每次循环中,创建了一个ARIMA模型对象,并将p、1(表示一阶差分)、q作为参数传递给order参数。然后使用拟合方法(fit)将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。同时,计算并记录了模型的AIC值,并将其添加到字符串列表str_list中。最后,使用循环打印出每个p和q值对应的模型的AIC值。
# R$ S  }2 [2 ]. G6 Amodel = ARIMA(df['val'], order=(2, 1, 0))3 Y- ^$ d5 D9 [* a, j
res = model.fit(disp=0)
, [. g2 i+ p+ h7 F0 T0 A% u; y) tres.summary()
1 F9 u& n# K, T! c$ D: E! M5 M, r5 R- ^
这部分代码创建了一个ARIMA模型对象,使用p=2、d=1(一阶差分)、q=0来进行参数配置。然后利用拟合方法将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。接下来,调用summary()方法打印出拟合后的模型的详细摘要信息,包括模型系数、标准误差、p值等。; x; Y9 b' C7 O, `& \
res.plot_predict(end=40)3 N% w; i7 h# U& I
2 r( F# o) Q7 i+ h
这行代码使用拟合后的模型(res)的plot_predict方法生成了一个预测图表。指定了end=40参数,表示要预测40个时间点。这个图表显示了原始数据和模型对未来值的预测。9 z; ]' K4 a6 ]: o
希望这些解释可以帮助你理解代码的每一行。如果还有进一步的问题,请随时提问。: F) P1 Y# d' R0 s
' G4 s# }7 O& R# T7 d) B

* f/ |. J- l0 U5 l

24.arima.py

1.51 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-4-17 02:45 , Processed in 0.390693 second(s), 54 queries .

回顶部