查看: 2706|回复: 0

ARIMA模型指数平滑法

字体大小: 正常放大

1189 主题	4 听众	2934 积分

该用户从未签到

电梯直达

1^#

发表于 2024-3-20 10:30 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

当涉及到时间序列数据分析和预测时，指数平滑法是一种常用的方法之一。它是一种简单而有效的平滑技术，可以用于处理具有趋势和季节性的时间序列数据。
指数平滑法基于以下假设：
1.过去的观测值对于预测未来的值更为重要。
2.近期的观测值对于预测的影响程度比过去的观测值更大。
3.观测值中的随机波动应该被消除，使得预测值更稳定。

指数平滑法有几种不同的变体，其中最常见的是简单指数平滑、二次指数平滑和三次指数平滑。

4.简单指数平滑（Simple Exponential Smoothing）：
简单指数平滑方法将所有观测值视为等权重，并使用一个平滑参数（通常表示为α）来确定各个观测值的权重。具体来说，简单指数平滑法的计算公式如下：

5.初始值：S₁ = X₁
6.平滑公式：Sₜ = α * Xₜ + (1 - α) * Sₜ₋₁
其中，Sₜ表示时刻 t 的平滑值，Xₜ表示时刻 t 的观测值。
7.二次指数平滑（Double Exponential Smoothing）：
二次指数平滑法相对于简单指数平滑法，将趋势也纳入考虑。它不仅考虑过去观测值的权重，还考虑了过去观测值的趋势。具体来说，二次指数平滑法的计算公式如下：

8.初始水平值：L₁ = X₁
9.初始趋势值：T₁ = X₂ - X₁
10.平滑公式（水平值）：Lₜ = α * Xₜ + (1 - α) * (Lₜ₋₁ + Tₜ₋₁)
11.平滑公式（趋势值）：Tₜ = β * (Lₜ - Lₜ₋₁) + (1 - β) * Tₜ₋₁
其中，Lₜ表示时刻 t 的水平值，Tₜ表示时刻 t 的趋势值，Xₜ表示时刻 t 的观测值，α和β是平滑参数。
12.三次指数平滑（Triple Exponential Smoothing）：
三次指数平滑法是在二次指数平滑法的基础上进一步考虑了季节性的影响。它适用于具有明显季节性模式的时间序列数据。具体来说，三次指数平滑法的计算公式如下：

13.初始水平值：L₁ = X₁
14.初始趋势值：T₁ = X₂ - X₁
15.初始季节性值：S₁ = X₃ - 2T₁ - L₁
16.平滑公式（水平值）：Lₜ = α * (Xₜ - Sₜ₋₃) + (1 - α) * (Lₜ₋₁ + Tₜ₋₁)
17.平滑公式（趋势值）：Tₜ = β * (Lₜ - Lₜ₋₁) + (1 - β) * Tₜ₋₁
18.平滑公式（季节性值）：Sₜ = γ * (Xₜ - Lₜ - Tₜ) + (1 - γ) * Sₜ₋₃
其中，Lₜ表示时刻 t 的水平值，Tₜ表示时刻 t 的趋势值，Sₜ表示时刻 t 的季节性值，Xₜ表示时刻 t 的观测值，α、β和γ是平滑参数。

请注意，指数平滑法适用于简单的时间序列模式，例如渐变性趋势或没有明显季节性模式的数据。对于更复杂的模式，如长期趋势、季节性和其他周期性模式，可以考虑使用更高级的模型，例如ARIMA模型。
ARIMA（Autoregressive Integrated Moving Average）模型是一种常用于时间序列分析和预测的统计模型，它将自回归（AR）、差分（I）和移动平均（MA）三种方法结合在一起。ARIMA模型根据时间序列数据的自相关性和移动平均性来拟合模型，并用于预测未来的数值。ARIMA模型通常用于处理具有复杂模式的时间序列数据，如具有长期趋势、季节性和周期性模式的数据。

# 导入所需的库
import numpy as np
import pandas as pd

# 源数据
df = pd.DataFrame({
't': [i for i in range(1, 11)],
'production': [2031, 2234, 2566, 2820, 3006,
               3093, 3277, 3514, 3770, 4107],
})

这段代码创建了一个DataFrame df，包含了时间(t)和产量(production)的数据。
# 设 alpha=.3，计算一次、二次指数平滑
alpha = .3
s1, s2 = [int(df['production'][0])],\
[int(df['production'][0])]

for i in range(1, len(df['t'])):
s1.append(alpha*df['production'][i] + (1-alpha)*s1[i-1])
s2.append(alpha*s1[i] + (1-alpha)*s2[i-1])
df['s1'] = s1
df['s2'] = s2

这段代码使用指数平滑法计算了一次指数平滑和二次指数平滑的值，并将结果添加到DataFrame df中的's1'和's2'列中。
# 计算过去年的预测值，以及未来年的线性表达式
predict_list = [None]
for i in range(len(df['t'])-1):
a = 2*df['s1'][i] - df['s2'][i]
b = (alpha / (1-alpha)) * (df['s1'][i] - df['s2'][i])
predict_list.append(a + b)

t = 10
a = 2*df['s1'][t-1] - df['s2'][t-1]
b = (alpha / (1-alpha)) * (df['s1'][t-1] - df['s2'][t-1])
df['predict'] = predict_list
print('at =', a)
print('bt =', b)

这段代码计算了过去年份的预测值，并给出了未来年份的线性表达式。其中a和b是线性表达式的参数，对应于二次指数平滑法的结果。将过去年份的预测值添加到DataFrame df的'predict'列中，并打印出a和b的值。
# 计算未来年的预测值
pred_df = df.copy()
for i in range(5):
pred_df = pd.concat([pred_df, pd.DataFrame({
      't': [10+i+1],
      'predict': a + b*i,
})])
pred_df

这段代码使用线性表达式计算了未来5年的预测值，并将结果添加到新的DataFrame pred_df中。
# 画图
import matplotlib.pyplot as plt

plt.plot(pred_df['t'], pred_df['production'],label='production')
plt.scatter(pred_df['t'], pred_df['production'])
plt.plot(pred_df['t'], pred_df['s1'],label='s1')
plt.scatter(pred_df['t'], pred_df['s1'])
plt.plot(pred_df['t'], pred_df['s2'],label='s2')
plt.scatter(pred_df['t'], pred_df['s2'])
plt.plot(pred_df['t'], pred_df['predict'],label='predict')
plt.scatter(pred_df['t'], pred_df['predict'])
plt.legend()

这段代码使用matplotlib库将实际产量、一次指数平滑、二次指数平滑和预测值的曲线图绘制出来。
希望以上解释对你有帮助。如果你还有任何问题，请随时提问。