QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1968|回复: 0
打印 上一主题 下一主题

python实现 ARIMA 模型 及逐行解释

[复制链接]
字体大小: 正常 放大

1176

主题

4

听众

2884

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-3-20 10:01 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
ARIMA(Autoregressive Integrated Moving Average)模型是一种常用的时间序列分析方法,用于对时间序列数据建模和预测。它通过结合自回归(AR)和滑动平均(MA)模型的特性,并对序列进行差分(Integration,即I)来建立模型。" X$ q" w3 v1 l" j
ARIMA模型的三个主要参数是p、d和q,分别对应于自回归、差分和滑动平均的阶数。7 ]5 x, e/ w5 H; e! d+ t& @# L
  u8 {; a5 h$ ^* s9 f& O6 `
1.自回归(AR):自回归部分使用先前时间点的观测值来预测当前值。p参数表示自回归的阶数,即使用多少个先前时间点的值作为预测输入。; _! y: B4 P* Z' P* [# Z
2.差分(I):差分是对时间序列进行一阶或多阶的差分操作,可以消除序列的非平稳性。d参数表示差分的阶数,默认为1阶差分。
# X6 X  r1 T" Z) P+ s3.滑动平均(MA):滑动平均部分使用先前的误差值来预测当前值。q参数表示滑动平均的阶数,即使用多少个先前的误差值作为预测输入。$ a- [& P) O7 |1 P7 B
, W! z- j3 O3 T5 f; b; n
ARIMA模型的一般表示形式为ARIMA(p, d, q),其中p、d和q是非负整数。它可以很好地处理具有线性趋势和季节性的时间序列数据。
* }! J0 ^+ e* t: b/ [$ K6 L: \
% S/ r% e# o1 D6 \6 ]( \% n5 F9 V- @9 T" o) e' I. @9 H: l& f
4.确定时间序列数据的平稳性,如平稳性检验、观察序列的趋势和季节性等。
. Z' I2 ?0 V1 d; O. ]2 j5.如果时间序列不平稳,进行差分操作以实现平稳性。
& C# C( X' Y1 O% n8 F6.通过观察ACF和PACF图来确定p和q的合适取值范围。/ {! q/ w+ C* Q; C7 ^8 B2 Z
7.根据AIC等准则,以不同的p、d、q值建立多个ARIMA模型。
+ i* m3 Q) Z' I, g- x8.对每个模型进行参数估计和模型拟合。
6 P& v2 H6 y) o* w: o9.使用拟合的模型进行预测,并对模型的拟合效果进行评估。0 k" l2 X$ u' o9 c3 N

" A" K5 p6 n$ Z) O% s( y# q; }1 Q9 M# mARIMA模型是时间序列分析领域中常用的模型之一,它可以用于预测未来趋势、季节性和周期性等时间序列数据的变化。在实际应用中,ARIMA模型可以被用于经济预测、股票市场分析、天气预测等各种领域。' ~7 U) m0 t& |& _
希望这个介绍对你有帮助。如果你还有任何问题,请随时提问。
# J3 w& E! h5 _: N# z( Yimport numpy as np
4 C0 P  ^# v& S/ |import pandas as pd
4 r8 G8 _2 o9 G" ]! P% bfrom statsmodels.tsa.arima_model import ARIMA- ?1 D) V! @! s( ^3 k- W0 E
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
4 y! Z2 S$ K4 A. e, @import matplotlib.pyplot as plt
+ X4 p, E; W+ ?. d
4 d# Z8 @& O& h2 D7 A2 F0 S% c这几行代码导入了所需的库,包括NumPy(用于数值计算)、Pandas(用于数据处理和分析)、statsmodels库中的ARIMA模型类和绘制时间序列图的函数,以及matplotlib用于绘图。, x2 C% r7 L& H+ k3 Q9 ^" }; l
df = pd.DataFrame({6 _3 D/ X6 v; @1 T
    'year': [i for i in range(1980, 2011)],3 w" L! y- f; D: y
    'val': [0.82989428, 0.85951092, 0.87668916, 0.86670716, 0.932052,- c4 K7 a2 ^# J! O7 \
            1.04826364, 1.3111932, 1.63756228, 2.0641074, 1.91268276,
4 u8 ?' `  I, q) u6 e            2.03544572, 2.17721128, 2.38968344, 2.75059208, 3.0906664,
6 I% L! I4 W. J  D1 G; M1 X            3.42664028, 3.83064908, 3.97190864, 3.83160036, 4.143101,
: Q' `, h( V# N            4.566551, 4.47541, 4.462796, 4.384829, 4.796861,
: ?* i! B# N, t" e& p/ Y            5.046211, 5.098759, 5.196519, 5.166843, 5.174744,% P+ Z& U& m# u( ]0 K# f' M
            5.440894],
% e$ ~' r+ A% f})
+ m( d. m1 b* s
6 j6 n% l+ U6 o5 G# ]5 l这段代码定义了一个名为df的Pandas DataFrame,其中包含了两列数据:'year'和'val'。'year'列包含了从1980年到2010年的年份数据,'val'列包含了与每个年份对应的值。
4 n/ m$ b% y1 }% `df['val_diff1'] = df['val'].diff()
$ r9 O$ u* M( f' @: n; ]9 Nplt.plot(df['year'], df['val'], label='origin')
+ e4 \' _: E2 M( H/ J9 r* \+ s2 ]plt.plot(df['year'], df['val_diff1'], label='diff1')
  p5 Q9 K6 B" ]% p% u  _" \. g, Aplt.legend()) [7 f1 A  o4 d6 w; z% U
& S% e& E7 w1 u- }
这段代码将计算'val'列的一阶差分,并将结果存储在一个新的'valdiff1'列中。然后使用matplotlib绘制了两条线:一条是原始'val'列的线,另一条是差分后的'valdiff1'列的线。plt.legend()函数用于显示图例。9 f9 R: |! I. w- R, Z
plot_acf(df['val_diff1'][1:])
$ @2 q; d% F& {/ T1 w+ ^" s
+ B5 p" ]. Y) s9 O这行代码使用plot_acf函数绘制了一阶差分后的序列('val_diff1'列)的自相关函数(ACF)图。ACF图用于展示序列在不同滞后阶数的相关性。
' F6 L7 k8 D! S2 L: X& x8 Vplot_pacf(df['val_diff1'][1:], lags=14)" X& n* F" ?) t# m: s
9 h* i5 I; U; f
这行代码使用plot_pacf函数绘制了一阶差分后的序列('val_diff1'列)的偏自相关函数(PACF)图。PACF图用于展示序列在不同滞后阶数的偏相关性,同时指定了lags=14参数,表示只展示14个滞后阶数的PACF值。
3 {& @4 r3 G) n2 J+ [  {5 W  lstr_list = []
0 \  Y4 T! W8 V$ j+ s* D9 p; _  @for p in range(1, 4):% v6 p, o5 T) _% f7 B, T- J- y
    for q in range(0, 4):
) E% _6 ]. ?: p        model = ARIMA(df['val'], order=(p, 1, q))
1 e3 h3 d' D$ h8 X0 k1 C; K5 I( W        res = model.fit(disp=0)* a/ r- `- P  Y1 Q! a$ ?
        str_list.append('p = {}, q = {}, aic = {}'.format(p, q, res.aic))
0 r9 ^; w: A( W' l" W. e5 T8 a( Mfor each in str_list:5 N' W9 b$ Z, c
    print(each)% w' Q% S5 w0 p  p
) I. v& ]& F5 @6 W- g% \8 B5 v
这段代码使用嵌套的for循环,遍历p和q的取值范围,分别为1到3和0到3。在每次循环中,创建了一个ARIMA模型对象,并将p、1(表示一阶差分)、q作为参数传递给order参数。然后使用拟合方法(fit)将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。同时,计算并记录了模型的AIC值,并将其添加到字符串列表str_list中。最后,使用循环打印出每个p和q值对应的模型的AIC值。1 C# C! \( F5 |) x( A1 N2 i8 y; m
model = ARIMA(df['val'], order=(2, 1, 0))
1 c* m9 K) E! L6 ~" p; ~! Pres = model.fit(disp=0)
% k" l: k/ _) o6 vres.summary()5 L; p6 o% |! e( |3 z) S6 @7 k
, A/ V, H. }& H/ F3 S, r8 A
这部分代码创建了一个ARIMA模型对象,使用p=2、d=1(一阶差分)、q=0来进行参数配置。然后利用拟合方法将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。接下来,调用summary()方法打印出拟合后的模型的详细摘要信息,包括模型系数、标准误差、p值等。+ d/ F" M8 v) v; j* b( [
res.plot_predict(end=40)
8 ^( c( r' y% |9 r$ {$ V$ m0 i# o& W# D/ I$ F9 M, R$ v  T' j
这行代码使用拟合后的模型(res)的plot_predict方法生成了一个预测图表。指定了end=40参数,表示要预测40个时间点。这个图表显示了原始数据和模型对未来值的预测。1 I* r: e* B: ~$ q
希望这些解释可以帮助你理解代码的每一行。如果还有进一步的问题,请随时提问。6 v; l+ A- K. C; d. `

: s8 L7 W7 v0 S9 i% J& [! ~# Y2 _1 u1 `+ U7 o

24.arima.py

1.51 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2025-9-16 11:03 , Processed in 0.375512 second(s), 54 queries .

回顶部