QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2419|回复: 0
打印 上一主题 下一主题

python实现 ARIMA 模型 及逐行解释

[复制链接]
字体大小: 正常 放大

1189

主题

4

听众

2934

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2024-3-20 10:01 |只看该作者 |正序浏览
|招呼Ta 关注Ta
ARIMA(Autoregressive Integrated Moving Average)模型是一种常用的时间序列分析方法,用于对时间序列数据建模和预测。它通过结合自回归(AR)和滑动平均(MA)模型的特性,并对序列进行差分(Integration,即I)来建立模型。
; B% S' q2 M0 b3 b; `# e5 aARIMA模型的三个主要参数是p、d和q,分别对应于自回归、差分和滑动平均的阶数。
4 D, a' G5 ~& P4 e% S5 I' a0 b8 Y# v& ~# R# {6 N
1.自回归(AR):自回归部分使用先前时间点的观测值来预测当前值。p参数表示自回归的阶数,即使用多少个先前时间点的值作为预测输入。
3 e( q1 c% l" F1 E, Y. M2.差分(I):差分是对时间序列进行一阶或多阶的差分操作,可以消除序列的非平稳性。d参数表示差分的阶数,默认为1阶差分。
. F, s$ x  X- {! R6 n% C* P" ^3.滑动平均(MA):滑动平均部分使用先前的误差值来预测当前值。q参数表示滑动平均的阶数,即使用多少个先前的误差值作为预测输入。/ z8 W& @/ i5 n7 y" s, o0 ~% I, `
* `+ M2 p* C+ N2 o
ARIMA模型的一般表示形式为ARIMA(p, d, q),其中p、d和q是非负整数。它可以很好地处理具有线性趋势和季节性的时间序列数据。
6 v6 e3 C) p% z1 ?  C% a) ~1 M: p5 j, n/ y4 n8 \1 p5 G

) J7 m$ F" e' s4.确定时间序列数据的平稳性,如平稳性检验、观察序列的趋势和季节性等。
/ m' i3 X+ S/ x4 L, ?4 A5.如果时间序列不平稳,进行差分操作以实现平稳性。
9 U7 @6 x- T% t) @6.通过观察ACF和PACF图来确定p和q的合适取值范围。/ \+ T) ~9 P/ F. u3 z: c& N
7.根据AIC等准则,以不同的p、d、q值建立多个ARIMA模型。. \' }2 A! e# r5 w9 F0 d4 K  c
8.对每个模型进行参数估计和模型拟合。: g0 I# f4 W2 R# b; }* q% f: Y
9.使用拟合的模型进行预测,并对模型的拟合效果进行评估。, _3 b3 i  k2 I. J( }( R

$ s* g; \2 l* Y# |- Y+ d% p# b0 rARIMA模型是时间序列分析领域中常用的模型之一,它可以用于预测未来趋势、季节性和周期性等时间序列数据的变化。在实际应用中,ARIMA模型可以被用于经济预测、股票市场分析、天气预测等各种领域。
, e! t* O1 K4 P+ a/ F希望这个介绍对你有帮助。如果你还有任何问题,请随时提问。* P5 E; r9 L# V
import numpy as np4 u+ M: g3 \* \7 Q
import pandas as pd# h$ X# l0 Q. o8 w# `
from statsmodels.tsa.arima_model import ARIMA0 g- I0 |$ Y+ ]  o7 i9 E# t* [
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
% Z5 ]) f- U( c2 F0 A# K2 {( y- _import matplotlib.pyplot as plt
2 v8 _; R8 W$ ?9 Q6 A4 D! |8 x3 t/ d( D6 |4 J4 ?% i0 r, V1 W' M' W
这几行代码导入了所需的库,包括NumPy(用于数值计算)、Pandas(用于数据处理和分析)、statsmodels库中的ARIMA模型类和绘制时间序列图的函数,以及matplotlib用于绘图。
0 m" P7 m8 C/ {" _) i. i8 `3 ldf = pd.DataFrame({& Y5 l: }0 S2 Z2 m$ L) w* R. r/ b
    'year': [i for i in range(1980, 2011)],
8 U; g4 r3 \8 p# H" w4 P    'val': [0.82989428, 0.85951092, 0.87668916, 0.86670716, 0.932052," V1 n% N' t$ q4 m
            1.04826364, 1.3111932, 1.63756228, 2.0641074, 1.91268276,9 p( p2 l) F% D& k1 p/ o
            2.03544572, 2.17721128, 2.38968344, 2.75059208, 3.0906664,
! X/ w4 e5 ?  e+ [* M+ G            3.42664028, 3.83064908, 3.97190864, 3.83160036, 4.143101,
, z* d8 y" z# l0 R            4.566551, 4.47541, 4.462796, 4.384829, 4.796861,9 e- o9 m) y& K+ ~" X
            5.046211, 5.098759, 5.196519, 5.166843, 5.174744,
3 D+ m& h, T3 H2 ~, z- Q            5.440894],
0 R  ]2 [( C' x, g}). N2 g' e5 d- k$ }$ n5 N% \

5 Y$ {: _$ s' D$ A# o/ ?4 M这段代码定义了一个名为df的Pandas DataFrame,其中包含了两列数据:'year'和'val'。'year'列包含了从1980年到2010年的年份数据,'val'列包含了与每个年份对应的值。% R$ S7 H- `% q$ T2 M9 T
df['val_diff1'] = df['val'].diff()
% I( `, _+ X3 c* J" `3 P% bplt.plot(df['year'], df['val'], label='origin')
6 c% ]6 K- l3 Rplt.plot(df['year'], df['val_diff1'], label='diff1')
7 G* {0 Y0 @& x6 T6 n1 x- f% Nplt.legend()
- F4 S! q+ o, K
; [. n3 P8 J- m0 P7 \这段代码将计算'val'列的一阶差分,并将结果存储在一个新的'valdiff1'列中。然后使用matplotlib绘制了两条线:一条是原始'val'列的线,另一条是差分后的'valdiff1'列的线。plt.legend()函数用于显示图例。7 J& y' Q) t, Z
plot_acf(df['val_diff1'][1:])  E6 m2 `! v+ ~. ^

  G5 \6 P6 T# k; }这行代码使用plot_acf函数绘制了一阶差分后的序列('val_diff1'列)的自相关函数(ACF)图。ACF图用于展示序列在不同滞后阶数的相关性。
  A) q3 D% M5 |- D- _6 S/ y- F3 o  _plot_pacf(df['val_diff1'][1:], lags=14)
6 ^. E) |$ ~) r6 A& f9 h3 G* g$ z
这行代码使用plot_pacf函数绘制了一阶差分后的序列('val_diff1'列)的偏自相关函数(PACF)图。PACF图用于展示序列在不同滞后阶数的偏相关性,同时指定了lags=14参数,表示只展示14个滞后阶数的PACF值。
* a4 i% {$ f4 H0 {: lstr_list = []
8 u: E2 Z" }+ mfor p in range(1, 4):. W- Z3 \+ X+ {; k8 L8 }" ?
    for q in range(0, 4):! |1 m9 k& E' O6 A* O6 J: K6 r
        model = ARIMA(df['val'], order=(p, 1, q))& ~5 P* _; Y! j+ s8 V+ z4 c& F# m4 j
        res = model.fit(disp=0)
+ i) Y& _: y% t( U: _' J: ?$ e        str_list.append('p = {}, q = {}, aic = {}'.format(p, q, res.aic))
4 Y$ C- ?1 m% s4 \) K6 ]( h* K$ g  z- xfor each in str_list:2 Y0 y# G  c4 R  x
    print(each)3 |6 j, a; A) l. T8 X
7 I! H- p: }8 N
这段代码使用嵌套的for循环,遍历p和q的取值范围,分别为1到3和0到3。在每次循环中,创建了一个ARIMA模型对象,并将p、1(表示一阶差分)、q作为参数传递给order参数。然后使用拟合方法(fit)将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。同时,计算并记录了模型的AIC值,并将其添加到字符串列表str_list中。最后,使用循环打印出每个p和q值对应的模型的AIC值。0 R# a( `/ b) R; }2 G
model = ARIMA(df['val'], order=(2, 1, 0))
0 k" R6 E  n# F+ ^& f% M1 mres = model.fit(disp=0)
( Q7 ~, K& U8 ]" [3 G. B( E. ?* i' Ires.summary()
" R: q* H" K! N* \3 N
; }4 L/ `9 P8 g& ^" R+ c这部分代码创建了一个ARIMA模型对象,使用p=2、d=1(一阶差分)、q=0来进行参数配置。然后利用拟合方法将模型拟合到'val'列的数据中,得到拟合后的模型对象(res)。接下来,调用summary()方法打印出拟合后的模型的详细摘要信息,包括模型系数、标准误差、p值等。( v( Z5 c" N% U0 q# J( g
res.plot_predict(end=40)
; Q3 S2 i2 y' T3 O4 X$ ^$ X3 h* T& e0 r4 ?# A& p/ R/ F
这行代码使用拟合后的模型(res)的plot_predict方法生成了一个预测图表。指定了end=40参数,表示要预测40个时间点。这个图表显示了原始数据和模型对未来值的预测。
8 |/ g* z  |& W% O* E希望这些解释可以帮助你理解代码的每一行。如果还有进一步的问题,请随时提问。
3 |# N1 D+ {' d8 _- Y( S, U; M& v4 w6 q

6 q. D, U' l, O# u

24.arima.py

1.51 KB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]

zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-6-15 03:58 , Processed in 0.407605 second(s), 55 queries .

回顶部