. y8 s$ K# H0 i
(2)概率估计 0 K9 n( G7 b; X ]5 ?; a3 k' S. L6 \
而对于概率估计,其中的代表是马尔科夫链算法,即先给数据划分状态,然后将数据的分布规律用状态转移来解释。最后对于当时数据的状态,利用根据状态间的转移概率可以求得未来的状态概率分布,自然也能求得下一状态的预测值。 ( }; h9 [, z9 L: e4 ]1 ]) J: ]4 V - U! L1 W S ]& d! z- a) H 比方说,我只去A,B,C,D四个食堂吃饭,现在告诉你我吃饭的记录,现在就需要计算我在这四个食堂中的转移概率,如我去食堂A吃过后再去四个食堂吃饭的概率是多少?通过这些转移概率不断推算我下一个要去的食堂,再根据四个转移概率得到最大可能去的食堂。但是这只是离散问题的预测,对于连续问题,自然也就需要将连续数据划分为若干个离散的状态,在使用此方法。 4 ?4 P+ Y* A7 X& B* u$ w% y0 f- l4 B3 p
此方法对于初学者来说掌握会比较困难,不过如果能成功使用会为论文添色不少,有兴趣的同学可以自行查找资料了解。(《数学建模算法与应用》一书上有讲解)5 I- J- [ M5 e2 _* b& a, B$ ^ J' y
% d/ u6 r" z, _/ i9 R- }' [4 P% } (3)时间序列2 c7 o% C0 O$ {' x4 t
+ O8 T: ^/ q/ W7 {
第三类称其为时间序列,因为输入是按顺序的离散值,大多数情况下就是时间,针对此类问题,由于输入以稳定步长增长的,所以不用考虑输入,直接研究输出的变化规律,这一点类似于高中学的数列,比方说有名的斐波那契数组:1,1,2,3,5...,它的数据特征是f(n+2)=f(n)+f(n+1),现在我们要求后面的数就直接利用该数据特征就行了,当然也可以求出其通项公式,有兴趣的同学可以求着试试。; B2 v2 x: y+ t+ m! Q
) f5 s: v. i! J/ Z: ]: A 而时间序列方面的算法其实就是猜测数据前后存在着什么关系,比如说:一次移动平均算法就是猜测每一个数据 与最近的部分数据的均值存在着某种关系,指数平滑法就是猜测每个数据都跟之前的历史数据的加权平均存在着某种关系。这些算法都可以算作是时间序列算法,不过以上算法都是对数据特征简单的猜测,而对于更复杂的数据特征则可能会用到微分方程,利用微分方程,即可以直接预测,还能用于灰色系统,从而将无规则数据转化为有规律的生成序列。! a v9 Y$ ~& P6 S% i: ^
" P i, Q- K. a' k- S. t5 D (4)机器学习0 s1 n2 C/ P: F7 e5 x8 `% C4 e0 V
7 t, X# a3 @ R3 ?
最后一个就是机器学习,即我们只需要搭好框架,数据特征则会由其自己挖掘,比较有名的有:支持向量机(SVM)、决策树、神经网络(深度学习)。这种算法的最终目的是模拟人脑的结构,它的好处就是在搭建好网络结构之后,通过对已有数据的学习,网络会自行提取数据特征,然后只要我们输入一个数据,网络将自行计算,然后输出它的预测值。这种方法的优点是方便,无需考虑数据规律和数据维度,而缺点则是要求数据量要大,少量样本的训练效果一般不具有适用性。 % e% H; `( ~& m y$ Z $ I P6 V3 `( o* U: b' I(5)模型检验3 @# h2 U. ?; _9 O: U, M$ v
# a ^/ Q, H3 _) A0 ?
预测问题中尤其还要注意的是对结果的检验,通常使用残差和后验误差等作为概率统计的检验,也可以用均方误差MSE检验。 * [/ i3 J" y2 h1 x2 p2 L5 b! j& P/ }4 o9 f1 ^$ f1 z
残差值反映了预测值和原始数据的相对差距: