QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2363|回复: 0
打印 上一主题 下一主题

python实现 ARIMA 模型 及逐行解释

[复制链接]
字体大小: 正常 放大

1186

主题

4

听众

2922

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-3-20 10:01 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
ARIMA(Autoregressive Integrated Moving Average)模型是一种常用的时间序列分析方法,用于对时间序列数据建模和预测。它通过结合自回归(AR)和滑动平均(MA)模型的特性,并对序列进行差分(Integration,即I)来建立模型。
) P& k2 K/ f* U1 Q9 v, I0 lARIMA模型的三个主要参数是p、d和q,分别对应于自回归、差分和滑动平均的阶数。
- u2 n% D1 o& ^" o6 b4 k3 E/ M
: a$ p( n/ v9 G1 C+ E$ k* R1.自回归(AR):自回归部分使用先前时间点的观测值来预测当前值。p参数表示自回归的阶数,即使用多少个先前时间点的值作为预测输入。& l' ^  ]0 L, d5 `# J
2.差分(I):差分是对时间序列进行一阶或多阶的差分操作,可以消除序列的非平稳性。d参数表示差分的阶数,默认为1阶差分。' s+ M) h8 ~: ^4 _5 |7 E
3.滑动平均(MA):滑动平均部分使用先前的误差值来预测当前值。q参数表示滑动平均的阶数,即使用多少个先前的误差值作为预测输入。4 J/ V$ X+ w& v: X' A
3 G8 d4 Y& o" h" {9 C+ n" I
ARIMA模型的一般表示形式为ARIMA(p, d, q),其中p、d和q是非负整数。它可以很好地处理具有线性趋势和季节性的时间序列数据。9 E/ t! ?$ M  M6 k  t9 ~

4 k$ x# P+ W. u" d# @' M. b1 s* L% c& A
4.确定时间序列数据的平稳性,如平稳性检验、观察序列的趋势和季节性等。
; ^8 V; x' q5 R& b, U5.如果时间序列不平稳,进行差分操作以实现平稳性。
8 p8 k- X9 ?6 e* \2 C; E6.通过观察ACF和PACF图来确定p和q的合适取值范围。
- y6 h0 |, i5 G' l! V' ^% N& W7.根据AIC等准则,以不同的p、d、q值建立多个ARIMA模型。
; ~" k6 M2 L3 s! f8.对每个模型进行参数估计和模型拟合。
: V( T$ q4 ^/ }" g9.使用拟合的模型进行预测,并对模型的拟合效果进行评估。
7 Z) h% H/ Q, a+ w9 z1 ~: y0 A2 R: l# N+ G, h& @% H% [, j
ARIMA模型是时间序列分析领域中常用的模型之一,它可以用于预测未来趋势、季节性和周期性等时间序列数据的变化。在实际应用中,ARIMA模型可以被用于经济预测、股票市场分析、天气预测等各种领域。+ ^8 m' ^1 A; y2 J# H' e6 R
希望这个介绍对你有帮助。如果你还有任何问题,请随时提问。/ V- V) d7 ~) u; [6 d& r
import numpy as np
: ~. R# Q9 a# i% v$ Zimport pandas as pd
& S! l: e* ^- @. Cfrom statsmodels.tsa.arima_model import ARIMA, ~. k3 b) d  O
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf$ [3 q& Z5 }% J
import matplotlib.pyplot as plt- j( z6 |9 O0 a) A! F  Q

, v/ |4 ~4 p" P3 H1 G这几行代码导入了所需的库,包括NumPy(用于数值计算)、Pandas(用于数据处理和分析)、statsmodels库中的ARIMA模型类和绘制时间序列图的函数,以及matplotlib用于绘图。
- ?% k. B& s4 |1 A! U( m1 s: s$ `df = pd.DataFrame({# R4 S& J9 Y3 w0 b
    'year': [i for i in range(1980, 2011)],! C' l: l, S3 M4 q! U
    'val': [0.82989428, 0.85951092, 0.87668916, 0.86670716, 0.932052,
, W" m7 H$ ~# G0 I9 N            1.04826364, 1.3111932, 1.63756228, 2.0641074, 1.91268276,+ G: l% K8 w: b+ b$ K
            2.03544572, 2.17721128, 2.38968344, 2.75059208, 3.0906664,
2 {6 z" f2 x5 Z+ I% D: N- Q            3.42664028, 3.83064908, 3.97190864, 3.83160036, 4.143101,
# v* v" |8 J( C& }# F8 q            4.566551, 4.47541, 4.462796, 4.384829, 4.796861,
; U9 f* z4 a' ~. b            5.046211, 5.098759, 5.196519, 5.166843, 5.174744,( f; j: r6 |+ e# B  u
            5.440894],$ w9 A2 \' A) y: w& x
})3 a- b" }4 j7 ]1 b

: ^4 ]$ E7 Y6 i. `% B) x/ J这段代码定义了一个名为df的Pandas DataFrame,其中包含了两列数据:'year'和'val'。'year'列包含了从1980年到2010年的年份数据,'val'列包含了与每个年份对应的值。
# M2 s) Z5 a2 h' s% Qdf['val_diff1'] = df['val'].diff()
' ~2 i! `! T$ eplt.plot(df['year'], df['val'], label='origin')
8 w' K5 @* q$ y  S- |; m1 jplt.plot(df['year'], df['val_diff1'], label='diff1')1 `7 _. E5 w: I$ h
plt.legend()
/ o5 {3 u; ?& j$ t7 x! [7 U
- d# t% [* K: P' r& z这段代码将计算'val'列的一阶差分,并将结果存储在一个新的'valdiff1'列中。然后使用matplotlib绘制了两条线:一条是原始'val'列的线,另一条是差分后的'valdiff1'列的线。plt.legend()函数用于显示图例。0 V9 y) E; M/ J" I" q% ?
plot_acf(df['val_diff1'][1:])# R% u3 `) w- r: |

) o- I2 D1 U4 S2 }这行代码使用plot_acf函数绘制了一阶差分后的序列('val_diff1'列)的自相关函数(ACF)图。ACF图用于展示序列在不同滞后阶数的相关性。
/ T) o4 |/ O5 A  x+ n; Q7 U8 p% Uplot_pacf(df['val_diff1'][1:], lags=14)
8 u& d& g4 n. U9 I9 k. ~+ m$ f- H% D6 E0 I
这行代码使用plot_pacf函数绘制了一阶差分后的序列('val_diff1'列)的偏自相关函数(PACF)图。PACF图用于展示序列在不同滞后阶数的偏相关性,同时指定了lags=14参数,表示只展示14个滞后阶数的PACF值。
( W" x  b# i$ l. o, t0 p3 q# O5 Pstr_list = []2 h5 j& t& s7 y( n
for p in range(1, 4):
! M1 Z* s- [6 [6 ]  v& r& T( N    for q in range(0, 4):: {, H) m, d$ {
        model = ARIMA(df['val'], order=(p, 1, q))- E5 E3 w1 i! y: v# U% b* e
        res = model.fit(disp=0)
/ X" C2 ?3 F4 o$ W        str_list.append('p = {}, q = {}, aic = {}'.format(p, q, res.aic))
9 x  j' [4 @& Q5 |" g- dfor each in str_list:, ?* P8 f% L' U
    print(each)& W+ g6 f4 [5 q- H

; v8 `8 m; A( h, ^  q这段代码使用嵌套的for循环,遍历p和q的取值范围,分别为1到3和0到3。在每次循环中,创建了一个ARIMA模型对象,并将p、1(表示一阶差分)、q作为参数传递给order参数。然后使用拟合方法(fit)将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。同时,计算并记录了模型的AIC值,并将其添加到字符串列表str_list中。最后,使用循环打印出每个p和q值对应的模型的AIC值。
8 i- N1 x# K) |$ N* n( v: \6 @$ Nmodel = ARIMA(df['val'], order=(2, 1, 0))
7 I  A' Q4 b) M( i: }) Z' Xres = model.fit(disp=0)
' O2 p8 ~; ]0 N0 _: F0 Dres.summary()  x( w( M, c0 C( D3 s+ w
7 k  A/ @. f; @9 w! H* s9 h
这部分代码创建了一个ARIMA模型对象,使用p=2、d=1(一阶差分)、q=0来进行参数配置。然后利用拟合方法将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。接下来,调用summary()方法打印出拟合后的模型的详细摘要信息,包括模型系数、标准误差、p值等。+ m/ \/ h+ L2 L: U0 d
res.plot_predict(end=40)
: x& }8 A2 h% n! \# s
% I) W# m+ I( G/ H& s1 G6 @" x这行代码使用拟合后的模型(res)的plot_predict方法生成了一个预测图表。指定了end=40参数,表示要预测40个时间点。这个图表显示了原始数据和模型对未来值的预测。* u* N/ }# h6 v6 ^, r
希望这些解释可以帮助你理解代码的每一行。如果还有进一步的问题,请随时提问。3 P8 e5 Q& q. E/ {0 ^9 m$ p, b
3 \5 d2 ]6 I2 J, M/ N8 N
$ O  K1 i6 }  J8 ?/ g+ i' i+ w8 h$ P* r- ^

24.arima.py

1.51 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-4-15 02:43 , Processed in 0.419145 second(s), 55 queries .

回顶部