QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2400|回复: 0
打印 上一主题 下一主题

python实现 ARIMA 模型 及逐行解释

[复制链接]
字体大小: 正常 放大

1188

主题

4

听众

2931

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-3-20 10:01 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
ARIMA(Autoregressive Integrated Moving Average)模型是一种常用的时间序列分析方法,用于对时间序列数据建模和预测。它通过结合自回归(AR)和滑动平均(MA)模型的特性,并对序列进行差分(Integration,即I)来建立模型。! N% k1 {1 h0 B6 p
ARIMA模型的三个主要参数是p、d和q,分别对应于自回归、差分和滑动平均的阶数。
. X. B. u; o; M1 y1 o/ w
! K' \& {$ N$ y* _/ ?1.自回归(AR):自回归部分使用先前时间点的观测值来预测当前值。p参数表示自回归的阶数,即使用多少个先前时间点的值作为预测输入。1 ]7 s+ ]5 z( v5 ~5 d
2.差分(I):差分是对时间序列进行一阶或多阶的差分操作,可以消除序列的非平稳性。d参数表示差分的阶数,默认为1阶差分。
2 C. |0 [+ O; L3.滑动平均(MA):滑动平均部分使用先前的误差值来预测当前值。q参数表示滑动平均的阶数,即使用多少个先前的误差值作为预测输入。3 F; p' Q. S3 e
! a& p5 x4 i3 [; e+ l/ P
ARIMA模型的一般表示形式为ARIMA(p, d, q),其中p、d和q是非负整数。它可以很好地处理具有线性趋势和季节性的时间序列数据。
, D; f+ X8 j7 b! E& D' O6 V: w3 C& G. x( u

6 ~6 z& P1 {- T  M, m0 Z9 L) p4.确定时间序列数据的平稳性,如平稳性检验、观察序列的趋势和季节性等。
* b0 J# ], t  v5 {4 n9 U5.如果时间序列不平稳,进行差分操作以实现平稳性。) j! Q1 J7 g$ k% h1 X: G( z
6.通过观察ACF和PACF图来确定p和q的合适取值范围。
* t7 K* A6 b2 v1 U( \" `  {7.根据AIC等准则,以不同的p、d、q值建立多个ARIMA模型。( X8 r2 P- X9 P/ L) [- p. u8 e9 B9 w
8.对每个模型进行参数估计和模型拟合。
2 q1 U, |2 L. T) s' D- [9.使用拟合的模型进行预测,并对模型的拟合效果进行评估。
. Z0 E9 h- K4 u: C+ c" X
" x7 x) _( ?" m+ E4 W8 `ARIMA模型是时间序列分析领域中常用的模型之一,它可以用于预测未来趋势、季节性和周期性等时间序列数据的变化。在实际应用中,ARIMA模型可以被用于经济预测、股票市场分析、天气预测等各种领域。( Q" d4 b% n$ l; S7 Y- D" h' [
希望这个介绍对你有帮助。如果你还有任何问题,请随时提问。
' u' M, H0 {: v0 D' Z5 Y7 j, ~0 Ximport numpy as np
- I7 D  t& r5 F% A3 t5 _2 ^import pandas as pd
- U# \. a1 q- [6 ^; i; [; w. F' _from statsmodels.tsa.arima_model import ARIMA
4 e; x# [0 A( y0 W9 o. L& g. gfrom statsmodels.graphics.tsaplots import plot_acf, plot_pacf
, w& @$ Q) e1 K# H( {7 eimport matplotlib.pyplot as plt
6 s/ }% N( P+ j6 f
% K7 r& z7 u; m% f1 E+ m* Y这几行代码导入了所需的库,包括NumPy(用于数值计算)、Pandas(用于数据处理和分析)、statsmodels库中的ARIMA模型类和绘制时间序列图的函数,以及matplotlib用于绘图。
  ?- K: v, F3 |' z$ rdf = pd.DataFrame({+ J: R& N6 R: Y* f5 D, f+ h9 G
    'year': [i for i in range(1980, 2011)],- G# u. U7 X  ^2 u7 a
    'val': [0.82989428, 0.85951092, 0.87668916, 0.86670716, 0.932052,
6 ?8 p5 o+ P: Q) P: y2 {1 e            1.04826364, 1.3111932, 1.63756228, 2.0641074, 1.91268276,
; f/ l8 ]! E" `: u0 _! Q            2.03544572, 2.17721128, 2.38968344, 2.75059208, 3.0906664,) n; n, Z+ d2 H8 F: U) s' p
            3.42664028, 3.83064908, 3.97190864, 3.83160036, 4.143101,
! }  W3 y' A' l5 N            4.566551, 4.47541, 4.462796, 4.384829, 4.796861,, M# R+ l$ C* J4 d, O2 l
            5.046211, 5.098759, 5.196519, 5.166843, 5.174744,. W: p' C5 }7 B' N) b) t' w
            5.440894],
( Q, f2 W6 v! g& `})1 V, T) G- R$ J* U  `

7 ~& G7 i/ p. Q" t6 s" _这段代码定义了一个名为df的Pandas DataFrame,其中包含了两列数据:'year'和'val'。'year'列包含了从1980年到2010年的年份数据,'val'列包含了与每个年份对应的值。
, z( ~! s% Y1 r# ^' M0 v& Idf['val_diff1'] = df['val'].diff()
7 U; a( G  Y7 W4 c2 Aplt.plot(df['year'], df['val'], label='origin')6 k' N' D0 D3 s% w4 e& n; E+ j- E
plt.plot(df['year'], df['val_diff1'], label='diff1')
" F' f2 D  }9 ~6 _+ S& k0 U  Uplt.legend()5 ]! V6 t1 B- D$ D( `+ C' A

0 O1 L/ q. z+ x% f% n7 ?这段代码将计算'val'列的一阶差分,并将结果存储在一个新的'valdiff1'列中。然后使用matplotlib绘制了两条线:一条是原始'val'列的线,另一条是差分后的'valdiff1'列的线。plt.legend()函数用于显示图例。
8 j5 D2 [0 w6 ]) w7 bplot_acf(df['val_diff1'][1:])0 C0 G& H# Q4 s9 w& d
+ V9 P% @# O$ v: B6 h" y9 f
这行代码使用plot_acf函数绘制了一阶差分后的序列('val_diff1'列)的自相关函数(ACF)图。ACF图用于展示序列在不同滞后阶数的相关性。  g0 |2 \' u! K0 l( E2 o
plot_pacf(df['val_diff1'][1:], lags=14), X9 u% I, `4 B8 d1 `4 m
) |' v; ~, V+ y% H% }# b. `! c
这行代码使用plot_pacf函数绘制了一阶差分后的序列('val_diff1'列)的偏自相关函数(PACF)图。PACF图用于展示序列在不同滞后阶数的偏相关性,同时指定了lags=14参数,表示只展示14个滞后阶数的PACF值。/ i8 j5 ?9 N  ^; }+ E
str_list = []2 Z5 p( \6 y1 M
for p in range(1, 4):: C8 C7 Y. G" a
    for q in range(0, 4):$ A; T. C2 E# x& R9 q0 P, b3 M. F
        model = ARIMA(df['val'], order=(p, 1, q))
; n8 _  u' V' A( e; a        res = model.fit(disp=0)
! s0 O) W3 o% z/ h( }) C- B( G4 v- |        str_list.append('p = {}, q = {}, aic = {}'.format(p, q, res.aic))
  Y! z  U5 Z/ Kfor each in str_list:0 t3 X: `7 t- H% O5 F9 \
    print(each)6 Y; o/ y0 Y- R  U9 I' p3 U1 \, I4 U% ^

$ k# p# f% e/ r这段代码使用嵌套的for循环,遍历p和q的取值范围,分别为1到3和0到3。在每次循环中,创建了一个ARIMA模型对象,并将p、1(表示一阶差分)、q作为参数传递给order参数。然后使用拟合方法(fit)将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。同时,计算并记录了模型的AIC值,并将其添加到字符串列表str_list中。最后,使用循环打印出每个p和q值对应的模型的AIC值。: _, m, ~" O! m* t/ G
model = ARIMA(df['val'], order=(2, 1, 0))
2 m" m9 S' ]* M6 Q+ h. qres = model.fit(disp=0)0 }4 I  `$ u2 ^: ]6 X3 Y
res.summary()
; i) h. b' `6 c: }5 Q2 ^/ ^
2 ~% C8 e1 z. W/ W8 Q这部分代码创建了一个ARIMA模型对象,使用p=2、d=1(一阶差分)、q=0来进行参数配置。然后利用拟合方法将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。接下来,调用summary()方法打印出拟合后的模型的详细摘要信息,包括模型系数、标准误差、p值等。
8 t0 c3 u- }; rres.plot_predict(end=40)
5 Z8 z$ E2 I3 z; d# h" m, N
, w  L7 D2 L) Z3 K, ~这行代码使用拟合后的模型(res)的plot_predict方法生成了一个预测图表。指定了end=40参数,表示要预测40个时间点。这个图表显示了原始数据和模型对未来值的预测。7 P* y9 G. i, a! F" j% _# T. F; \
希望这些解释可以帮助你理解代码的每一行。如果还有进一步的问题,请随时提问。
: [% R: D4 W6 p6 a- J$ J1 [5 }; N& U) s1 p; h3 B4 F
3 T/ s4 U' i' F3 M2 O

24.arima.py

1.51 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-5-26 01:40 , Processed in 0.699946 second(s), 55 queries .

回顶部