查看: 2041|回复: 0

BP神经网络进行数据预测（matlab版）

字体大小: 正常放大

1188 主题	4 听众	2931 积分

该用户从未签到

电梯直达

1^#

发表于 2023-8-19 15:20 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

在本文中使用BP神经网络进行数据预测的功能。具体来说，它使用了BP神经网络模型进行公路客运量和公路货运量的预测。这个问题涉及了了解和预测公路客运量和公路货运量的变化趋势。公路客运量指的是公路上人数的运输量，而公路货运量表示公路上货物的运输量。

通过分析与这两个指标相关的数据，如人口数量、机动车数量和公路面积，代码通过BP神经网络模型构建了一个预测模型。预测模型的目标是根据输入的数据（人口数量、机动车数量和公路面积）来预测公路客运量和公路货运量的值。

以下是bp神经网络的简单介绍：

BP神经网络，即反向传播神经网络（Backpropagation Neural Network），是一种常用的人工神经网络模型。它是一种具有前馈和反向传播机制的多层前馈神经网络，是一种有监督的学习算法，适用于解决分类和回归问题。

BP神经网络由输入层、隐藏层和输出层组成，每个层都由多个神经元（节点）组成。每个神经元与上一层和下一层的神经元相连接，并且每条连接都有一个权重。

BP神经网络的学习分为两个过程：前向传播和反向传播。

前向传播：从输入层开始，将输入样本输入网络，经过每一层的神经元的计算，最终得到输出层的输出结果。在前向传播过程中，每个神经元根据其输入信号和权重进行加权求和，并通过激活函数（如sigmoid函数）进行非线性变换，生成该神经元的输出。

反向传播：将网络的输出结果与期望输出进行比较，计算输出误差。然后将误差从输出层向输入层反向传播，根据误差调整网络中的权重。反向传播使用梯度下降算法来最小化误差，通过不断迭代调整权重，使网络的输出逼近期望输出。

在反向传播过程中，首先计算输出层的误差，然后逐层向前计算隐藏层的误差，直到达到输入层。根据误差计算的结果，更新每个连接权重的值，以减小误差。

BP神经网络的训练过程是通过多次迭代更新权重，不断调整网络的连接权重和阈值，使得网络的输出逼近期望输出。网络的训练通常以某个终止准则为条件，如达到预定的训练次数或达到期望的误差阈值。

以下是对给出的代码的详细解释：
clc                         % 清屏
clear all;                %清除内存以便加快运算速度
close all;                %关闭当前所有figure图像
这些代码行清空了 MATLAB 的命令窗口、清除了工作区中的所有变量和关闭了所有图形窗口。

SamNum=20;                %输入样本数量为20
TestSamNum=20;             %测试样本数量也是20
ForcastSamNum=2;          %预测样本数量为2
HiddenUnitNum=8;          %中间层隐节点数量取8,比工具箱程序多了1个
InDim=3;                   %网络输入维度为3
OutDim=2;                %网络输出维度为2
定义了样本数量、测试样本数量、预测样本数量以及神经网络的隐层节点数量、输入维度和输出维度。

%原始数据
%人数(单位：万人)
sqrs=[20.55 22.44 25.37 27.13 29.45 30.10 30.96 34.06 36.42 38.09 39.13 39.99 ...
   41.93 44.59 47.30 52.89 55.73 56.76 59.17 60.63];
%机动车数(单位：万辆)
sqjdcs=[0.6 0.75 0.85 0.9 1.05 1.35 1.45 1.6 1.7 1.85 2.15 2.2 2.25 2.35 2.5 2.6...
      2.7 2.85 2.95 3.1];
%公路面积(单位：万平方公里)
sqglmj=[0.09 0.11 0.11 0.14 0.20 0.23 0.23 0.32 0.32 0.34 0.36 0.36 0.38 0.49 ...
      0.56 0.59 0.59 0.67 0.69 0.79];
%公路客运量(单位：万人)
glkyl=[5126 6217 7730 9145 10460 11387 12353 15750 18304 19836 21024 19490 20433 ...
      22598 25107 33442 36836 40548 42927 43462];
%公路货运量(单位：万吨)
glhyl=[1237 1379 1385 1399 1663 1714 1834 4322 8132 8936 11099 11203 10524 11115 ...
      13320 16762 18673 20724 20803 21804];
p=[sqrs;sqjdcs;sqglmj];  %输入数据矩阵
t=[glkyl;glhyl];          %目标数据矩阵
[SamIn,minp,maxp,tn,mint,maxt]=premnmx(p,t); %原始样本对（输入和输出）初始化
给出了一些原始数据，包括人数、机动车数、公路面积、公路客运量和公路货运量。然后将输入数据矩阵p和目标数据矩阵t进行归一化处理，返回归一化后的样本输入SamIn，归一化参数minp和maxp，以及归一化后的目标输出tn和归一化参数mint和maxt。

rand('state',sum(100*clock)) %依据系统时钟种子产生随机数
NoiseVar=0.01;                   %噪声强度为0.01（添加噪声的目的是为了防止网络过度拟合）
Noise=NoiseVar*randn(2,SamNum); %生成噪声
SamOut=tn + Noise;                %将噪声添加到输出样本上
设置随机数种子并生成一些噪声数据，将这些噪声添加到归一化后的目标数据tn上，得到带噪声的样本输出SamOut。

TestSamIn=SamIn;                         %这里取输入样本与测试样本相同因为样本容量偏少
TestSamOut=SamOut;                      %也取输出样本与测试样本相同
将用于测试的样本输入TestSamIn设置为与训练样本输入SamIn相同，将用于测试的样本输出TestSamOut设置为与训练样本输出SamOut相同。

MaxEpochs=50000;                            %最多训练次数为50000
lr=0.035;                                     %学习速率为0.035
E0=0.65*10^(-3);                            %目标误差为0.65*10^(-3)
W1=0.5*rand(HiddenUnitNum,InDim)-0.1; %初始化输入层与隐含层之间的权值
B1=0.5*rand(HiddenUnitNum,1)-0.1;    %初始化输入层与隐含层之间的阈值
W2=0.5*rand(OutDim,HiddenUnitNum)-0.1; %初始化输出层与隐含层之间的权值
B2=0.5*rand(OutDim,1)-0.1;             %初始化输出层与隐含层之间的阈值
定义了最大训练次数MaxEpochs、学习速率lr和目标误差E0。然后，随机地初始化输入层与隐含层之间的权值W1和阈值B1，以及输出层与隐含层之间的权值W2和阈值B2。

ErrHistory=zeros(MaxEpochs,1);                            %给中间变量预先占据内存
for i=1:MaxEpochs

HiddenOut=logsig(W1*SamIn+repmat(B1,1,SamNum)); % 隐含层网络输出
NetworkOut=W2*HiddenOut+repmat(B2,1,SamNum); % 输出层网络输出
Error=SamOut-NetworkOut;                      % 实际输出与网络输出之差
SSE=sumsqr(Error);                            %能量函数（误差平方和）
ErrHistory(i)=SSE;

if SSE<E0,break, end    %如果达到误差要求则跳出学习循环

% 以下六行是BP网络最核心的程序
% 他们是权值（阈值）依据能量函数负梯度下降原理所作的每一步动态调整量
Delta2=Error;
Delta1=W2'*Delta2.*HiddenOut.*(1-HiddenOut);

dW2=Delta2*HiddenOut';
dB2=Delta2*ones(SamNum,1);

dW1=Delta1*SamIn';
dB1=Delta1*ones(SamNum,1);
%对输出层与隐含层之间的权值和阈值进行修正
W2=W2+lr*dW2;
B2=B2+lr*dB2;
%对输入层与隐含层之间的权值和阈值进行修正
W1=W1+lr*dW1;
B1=B1+lr*dB1;
end
使用BP算法进行神经网络的训练。通过迭代调整权值和阈值来减小实际输出与期望输出之间的误差。迭代过程中，计算隐含层的输出HiddenOut和输出层的输出NetworkOut，计算误差Error，计算能量函数（误差平方和）SSE，并将其保存在ErrHistory中。如果误差小于目标误差E0，则跳出学习循环。核心的BP算法部分涉及到误差的反向传播和权值、阈值的调整。

HiddenOut=logsig(W1*SamIn+repmat(B1,1,TestSamNum)); % 隐含层输出最终结果
NetworkOut=W2*HiddenOut+repmat(B2,1,TestSamNum); % 输出层输出最终结果
a=postmnmx(NetworkOut,mint,maxt);             % 还原网络输出层的结果
x=1990:2009;                                     % 时间轴刻度
newk=a(1,

; % 网络输出客运量
newh=a(2,

;                                     % 网络输出货运量
figure ;
subplot(2,1,1);plot(x,newk,'r-o',x,glkyl,'b--+') %绘值公路客运量对比图；
legend('网络输出客运量','实际客运量');
xlabel('年份');ylabel('客运量/万人');
subplot(2,1,2);plot(x,newh,'r-o',x,glhyl,'b--+')    %绘制公路货运量对比图；
legend('网络输出货运量','实际货运量');
xlabel('年份');ylabel('货运量/万吨');
使用训练好的神经网络对测试样本进行预测并还原归一化结果。将还原后的网络输出结果与实际数据绘制成图形进行对比展示

pnew=[73.39 75.55
   3.9635 4.0975
   0.9880 1.0268];                   %2010年和2011年的相关数据；
pnewn=tramnmx(pnew,minp,maxp);       %利用原始输入数据的归一化参数对新数据进行归一化；
HiddenOut=logsig(W1*pnewn+repmat(B1,1,ForcastSamNum)); % 隐含层输出预测结果
anewn=W2*HiddenOut+repmat(B2,1,ForcastSamNum);          % 输出层输出预测结果
%把网络预测得到的数据还原为原始的数量级；
anew=postmnmx(anewn,mint,maxt);

给出了新的输入数据pnew，对其进行归一化处理得到归一化后的输入数据pnewn。然后，使用训练好的神经网络对归一化后的输入数据进行预测，得到归一化后的预测结果。最后，利用逆归一化操作将预测结果恢复为原始的数量级。
该段代码主要包括数据预处理、神经网络的训练和预测，以及结果的可视化展示。通过训练得到的神经网络，可以对输入数据进行预测并输出相应的结果。

对于代码将以附件形式给出