查看: 2364|回复: 0

ARMA 模型使用拟合的模型进行预测

字体大小: 正常放大

1189 主题	4 听众	2934 积分

该用户从未签到

电梯直达

1^#

发表于 2024-3-20 10:19 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

ARIMA（Autoregressive Integrated Moving Average）模型是一种常用的时间序列分析方法，用于对时间序列数据建模和预测。它通过结合自回归（AR）和滑动平均（MA）模型的特性，并对序列进行差分（Integration，即I）来建立模型。
ARIMA模型的三个主要参数是p、d和q，分别对应于自回归、差分和滑动平均的阶数。

1.自回归（AR）：自回归部分使用先前时间点的观测值来预测当前值。p参数表示自回归的阶数，即使用多少个先前时间点的值作为预测输入。
2.差分（I）：差分是对时间序列进行一阶或多阶的差分操作，可以消除序列的非平稳性。d参数表示差分的阶数，默认为1阶差分。
3.滑动平均（MA）：滑动平均部分使用先前的误差值来预测当前值。q参数表示滑动平均的阶数，即使用多少个先前的误差值作为预测输入。

ARIMA模型的一般表示形式为ARIMA(p, d, q)，其中p、d和q是非负整数。它可以很好地处理具有线性趋势和季节性的时间序列数据。
ARIMA模型的建立包括以下步骤：

4.确定时间序列数据的平稳性，如平稳性检验、观察序列的趋势和季节性等。
5.如果时间序列不平稳，进行差分操作以实现平稳性。
6.通过观察ACF和PACF图来确定p和q的合适取值范围。
7.根据AIC等准则，以不同的p、d、q值建立多个ARIMA模型。
8.对每个模型进行参数估计和模型拟合。
9.使用拟合的模型进行预测，并对模型的拟合效果进行评估。

ARIMA模型是时间序列分析领域中常用的模型之一，它可以用于预测未来趋势、季节性和周期性等时间序列数据的变化。在实际应用中，ARIMA模型可以被用于经济预测、股票市场分析、天气预测等各种领域。

# 导入所需的库
import numpy as np
import pandas as pd
import statsmodels.api as sm
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
import matplotlib.pyplot as plt

这些是导入需要使用的库，包括NumPy、Pandas、statsmodels和matplotlib。
# 源数据
df = pd.DataFrame({
'year': [i for i in range(1971, 1991)],
'num': [66.6, 68.9, 38, 34.5, 15.5,
         12.6, 27.5, 92.5, 155.4, 154.6,
         140.4, 115.9, 66.6, 45.9, 17.9,
         3.4, 29.4, 100.2, 157.6, 142.6],
})

这里创建了一个DataFrame df，包含年份和对应的数据值。这个数据将用于建立ARIMA模型。
# 画 acf 图
plot_acf(df['num'])

这段代码用于画出序列的自相关函数（ACF）图。ACF图可以帮助我们分析时间序列数据的自相关性。
# 画 pacf 图
plot_pacf(df['num'], lags=9)

这段代码用于画出序列的偏自相关函数（PACF）图。PACF图可以帮助我们分析时间序列数据的偏自相关性。
# 建立模型，参考 acf、pacf 代入 p、q，观察 aic
str_list = []
for p in range(1, 6):
for q in range(1, 3):
      model = sm.tsa.ARMA(df['num'], (p, q)).fit()
      str_list.append('p = {}, q = {}, aic = {}'.format(p, q, model.aic))
for each in str_list:
print(each)

这段代码用于建立ARIMA模型并观察模型的AIC（赤池信息准则）值。通过对不同(p, q)值的组合进行模型拟合，并输出对应的AIC值，以便选择最优的(p, q)值。
# 发现 p=2,q=2 时 aic 最小，取 p=2,q=2
model = sm.tsa.ARMA(df['num'], (2, 2)).fit()
model.summary()

根据观察AIC值的结果，选择最优(p, q)值为(2, 2)，然后建立ARIMA模型并进行拟合。
# 预测和画图
plt.plot(df['year'], df['num'])
plt.scatter(df['year'], df['num'], label='actual')
year_list = [i for i in range(1971, 2001)]
plt.plot(year_list, model.predict(0, len(year_list)-1))
plt.scatter(year_list, model.predict(0, len(year_list)-1), label='predict')
plt.legend()

这段代码用于使用拟合的模型进行预测，并绘制实际值和预测值的图表。首先画出实际值的曲线，然后画出预测值的曲线，并将预测值的点标记在图上。
希望以上解释对你有帮助。如果你还有任何问题，请随时提问。