QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2359|回复: 0
打印 上一主题 下一主题

python实现 ARIMA 模型 及逐行解释

[复制链接]
字体大小: 正常 放大

1186

主题

4

听众

2922

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-3-20 10:01 |只看该作者 |正序浏览
|招呼Ta 关注Ta
ARIMA(Autoregressive Integrated Moving Average)模型是一种常用的时间序列分析方法,用于对时间序列数据建模和预测。它通过结合自回归(AR)和滑动平均(MA)模型的特性,并对序列进行差分(Integration,即I)来建立模型。: s" h% ^9 s; h  y
ARIMA模型的三个主要参数是p、d和q,分别对应于自回归、差分和滑动平均的阶数。7 ~  }0 H6 I0 O! ]$ H, Q) y4 T

" ]- m! o2 J8 D5 m" i4 J1.自回归(AR):自回归部分使用先前时间点的观测值来预测当前值。p参数表示自回归的阶数,即使用多少个先前时间点的值作为预测输入。
+ i& T; k  U5 C2 y. Y2.差分(I):差分是对时间序列进行一阶或多阶的差分操作,可以消除序列的非平稳性。d参数表示差分的阶数,默认为1阶差分。
4 w* K/ o4 B  H; e5 s; \: D5 @. |3.滑动平均(MA):滑动平均部分使用先前的误差值来预测当前值。q参数表示滑动平均的阶数,即使用多少个先前的误差值作为预测输入。* F3 R* o, G) B$ Z  l
) ^$ H; ?( U+ s* @
ARIMA模型的一般表示形式为ARIMA(p, d, q),其中p、d和q是非负整数。它可以很好地处理具有线性趋势和季节性的时间序列数据。
0 z, r" z7 a& {* ^0 j4 b% Z+ K0 L$ Q0 c" T
* g( A$ H5 c* X$ `7 ?1 \
4.确定时间序列数据的平稳性,如平稳性检验、观察序列的趋势和季节性等。
; H) ~" z, ]$ e$ b* x( y5.如果时间序列不平稳,进行差分操作以实现平稳性。. O- s1 g, R3 U6 c1 B" I
6.通过观察ACF和PACF图来确定p和q的合适取值范围。
' e6 ?7 l6 |; Q3 b7.根据AIC等准则,以不同的p、d、q值建立多个ARIMA模型。
$ q- A$ _. v! y- T& e$ i8.对每个模型进行参数估计和模型拟合。. `5 I7 R1 L6 |! B" ?7 _
9.使用拟合的模型进行预测,并对模型的拟合效果进行评估。2 u4 @" K& h$ G; P

2 c6 A+ ^) @. cARIMA模型是时间序列分析领域中常用的模型之一,它可以用于预测未来趋势、季节性和周期性等时间序列数据的变化。在实际应用中,ARIMA模型可以被用于经济预测、股票市场分析、天气预测等各种领域。6 n8 E7 G) `. t  h5 \
希望这个介绍对你有帮助。如果你还有任何问题,请随时提问。" P/ N$ E# E1 b8 _6 A' x: m; ?- u( y
import numpy as np  D: ]9 j* b. y; n) A
import pandas as pd
+ N! O  A* u: h, yfrom statsmodels.tsa.arima_model import ARIMA6 O: I; J$ ^& V, N- N7 b, N
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf$ r3 d  {# g. y# U1 `; s
import matplotlib.pyplot as plt
# w7 |3 G! ]! u2 a" i: N% i; K) K
; j& \3 i$ d' T8 ^5 w* [这几行代码导入了所需的库,包括NumPy(用于数值计算)、Pandas(用于数据处理和分析)、statsmodels库中的ARIMA模型类和绘制时间序列图的函数,以及matplotlib用于绘图。
& k: \, ?! ~9 `( E) ]$ pdf = pd.DataFrame({' U* m% T1 J8 F0 }" u9 K  d
    'year': [i for i in range(1980, 2011)],0 k8 |$ K- ]) Y. s9 H/ h
    'val': [0.82989428, 0.85951092, 0.87668916, 0.86670716, 0.932052,6 v0 |, [9 _9 }# P3 h. K* J, t) w
            1.04826364, 1.3111932, 1.63756228, 2.0641074, 1.91268276,$ N( _% B3 L$ o
            2.03544572, 2.17721128, 2.38968344, 2.75059208, 3.0906664,0 c7 U6 l. E+ W5 o, n0 D% k
            3.42664028, 3.83064908, 3.97190864, 3.83160036, 4.143101,
- |; U. y$ |6 p            4.566551, 4.47541, 4.462796, 4.384829, 4.796861,# p& R% c2 O/ L; W: d
            5.046211, 5.098759, 5.196519, 5.166843, 5.174744,
% J6 x- q" j. V7 r* ^; |6 W* ^* U; w4 N            5.440894],! ^# Y+ _& B; W. x+ u
})
5 l/ b. L. H) B3 @, Z, G
1 U' I3 c. N' R( z# g这段代码定义了一个名为df的Pandas DataFrame,其中包含了两列数据:'year'和'val'。'year'列包含了从1980年到2010年的年份数据,'val'列包含了与每个年份对应的值。
- w* C1 i3 S. [" b7 e) w( ?! Cdf['val_diff1'] = df['val'].diff()
; t# a0 |" z' r: aplt.plot(df['year'], df['val'], label='origin')/ z# T9 h' u. w. i6 A8 D/ H
plt.plot(df['year'], df['val_diff1'], label='diff1')
. g0 H1 m, T& g$ k; Y$ l$ ~plt.legend()0 U: r" R  K+ T# s2 F& p6 v' L
9 e1 L. g2 p& F2 l
这段代码将计算'val'列的一阶差分,并将结果存储在一个新的'valdiff1'列中。然后使用matplotlib绘制了两条线:一条是原始'val'列的线,另一条是差分后的'valdiff1'列的线。plt.legend()函数用于显示图例。
1 `9 v2 R8 }& _: C+ C6 l2 \/ f" Gplot_acf(df['val_diff1'][1:])
  ?) N# o, x6 B+ b9 K8 q+ ^/ ^# e+ h) z. g- S
这行代码使用plot_acf函数绘制了一阶差分后的序列('val_diff1'列)的自相关函数(ACF)图。ACF图用于展示序列在不同滞后阶数的相关性。
! k/ \+ t; l. `  V0 G* P8 }) yplot_pacf(df['val_diff1'][1:], lags=14)
  `- ?5 b" Q- ?6 h$ _0 [
, b6 x7 Z3 a& `6 ~( p这行代码使用plot_pacf函数绘制了一阶差分后的序列('val_diff1'列)的偏自相关函数(PACF)图。PACF图用于展示序列在不同滞后阶数的偏相关性,同时指定了lags=14参数,表示只展示14个滞后阶数的PACF值。
! C1 M; |' A! o9 b& N) S% Q; ], F0 Dstr_list = []
8 ^' V6 o8 v: F) ~% l( q0 Bfor p in range(1, 4):+ R9 M. u; e# H2 q% ^0 t7 W$ y
    for q in range(0, 4):
8 C% m5 ]7 U; k( a1 Z6 v        model = ARIMA(df['val'], order=(p, 1, q))9 w7 _4 ^% |- ^- X$ A
        res = model.fit(disp=0)1 g7 }. Y: |, d) e. Z' K9 O
        str_list.append('p = {}, q = {}, aic = {}'.format(p, q, res.aic))
% C/ _9 R- g" _7 z4 ofor each in str_list:
. i. M6 R. ?# y& L2 J' k6 V    print(each); K. e% S* j5 o, p* w2 y

8 {! x( i) b( I7 b- \5 s( b; l这段代码使用嵌套的for循环,遍历p和q的取值范围,分别为1到3和0到3。在每次循环中,创建了一个ARIMA模型对象,并将p、1(表示一阶差分)、q作为参数传递给order参数。然后使用拟合方法(fit)将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。同时,计算并记录了模型的AIC值,并将其添加到字符串列表str_list中。最后,使用循环打印出每个p和q值对应的模型的AIC值。
5 [6 U. Y- M1 y' T& c! S% H, nmodel = ARIMA(df['val'], order=(2, 1, 0))
0 h* B9 u% ?, ]1 y+ d3 Ires = model.fit(disp=0)
0 H/ C8 i: d! J8 t+ [2 y) `% sres.summary(), m& g* D6 F+ K  q5 x! P' @
' R6 }* e, D, P5 b7 l' a2 N6 a
这部分代码创建了一个ARIMA模型对象,使用p=2、d=1(一阶差分)、q=0来进行参数配置。然后利用拟合方法将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。接下来,调用summary()方法打印出拟合后的模型的详细摘要信息,包括模型系数、标准误差、p值等。
+ {  P+ J4 U8 l4 rres.plot_predict(end=40)
$ V/ w1 [7 }0 I2 f7 D- J' Q7 N9 ^$ w% g7 A6 o' f2 F
这行代码使用拟合后的模型(res)的plot_predict方法生成了一个预测图表。指定了end=40参数,表示要预测40个时间点。这个图表显示了原始数据和模型对未来值的预测。, P) K& o! O4 f4 P0 v
希望这些解释可以帮助你理解代码的每一行。如果还有进一步的问题,请随时提问。
# @8 {6 r" l7 U3 g; C
# {3 _' n' f$ f& d* P0 Y+ m( g' C5 z
! A' z% v  A+ O; |8 t

24.arima.py

1.51 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-4-14 10:35 , Processed in 0.435395 second(s), 56 queries .

回顶部