/ n- k# ~/ g* D' o- B8 l正确:对大部分样本可以正确的划分类别& f/ R. _' P/ A0 X
) ]3 w% B) r& R; k泛化:最大化支持向量间距5 t; w9 d+ I& H' Y- [' v5 C
+ P& p3 }/ q$ w: O1 u1 J7 o8 S0 A
公平:与支持向量等距 : ^2 C; f9 d; r! s U. |" F7 Z / ]3 E8 D' D- W& Q; Z1 ~简单:线性、直线或平面,分割超平面4 ^$ h/ A2 u6 u0 B) E; [
' }$ P$ w' F- c- f, g/ U2.基于核函数的生维变换% L3 M# A$ K3 w3 K$ i, d
- U( Z" {2 O0 N5 G- S# O通过名为核函数的特征变换,增加新的特征,使得低维度的线性不可分问题变为高维度空间中线性可分问题。 , V1 H' U G+ C6 m2 ]! C. v0 Y0 @. w$ x" L& A1 W7 Y: N
一、引论 , O& l! U& p+ [ L) B# a . O( C' U7 V- r2 O3 ]' ^使用SVM支持向量机一般用于分类,得到低错误率的结果。SVM能够对训练集意外的数据点做出很好的分类决策。那么首先我们应该从数据层面上去看SVM到底是如何做决策的,这里来看这样一串数据集集合在二维平面坐标系上描绘的图: + Z( z+ v$ e. r2 O7 ]( E+ w# X. u* f2 a5 d6 o/ |3 \
0 D7 d: \! j z \8 W
' ~8 ^8 X' [& @: ^8 a @现在我们需要考虑,是否能够画出一条直线将圆形点和星星点分开。像first第一张图片来看,圆点和星点就分的很开,很容易就可以在图中画出一条直线将两组数据分开。而看第二张图片,圆点和星点几乎都聚合在一起,要区分的话十分困难。! Y& d# {- B/ u3 C* o7 g
+ j4 O5 A6 \ E" P; @
我们要划线将他们区分开来的话,有有无数条可以画,但是我们难以找到一条最好区分度最高的线条将它们几乎完全区分。那么在此我们需要了解两个关于数据集的基本概念: - Q9 n1 k* W! R3 P. Y3 b% l; K+ N# O* W+ e4 E `( l+ f1 r
二、理论铺垫- @0 k& J8 Q* D4 g$ o) c) g
# Q2 ~1 W* G9 M# _! e! F
线性可分性(linear separability) + J% s6 w% W5 L# H+ ~8 m: P$ q' ?1 L2 Y. Z5 ]( v
; Y- u6 b4 Z9 Z3 z; O$ [: L( x( l
- G8 Q! S6 ~: c' q+ `而对机器学习来说,涉及的多是高维空间(多维度)的数据分类,高维空间的SVM,即为超平面。机器学习的最终目的就是要找到最合适的(也即最优的)一个分类超平面(Hyper plane),从而应用这个最优分类超平面将特征数据很好地区分为两类。! t3 N( u" D1 Y. K; R1 w
$ ~5 L [ G$ X 9 {/ C0 n$ T, G- p5 O 8 k% X" X# Z6 Z2 y* y决策边界6 m- o2 ~' N) s0 `4 N
0 p0 q8 h$ Q( kSVM是一种优化的分类算法,其动机是寻找一个最佳的决策边界,使得从决策边界与各组数据之间存在margin,并且需要使各侧的margin最大化。那么这个决策边界就是不同类之间的界限。 ' I% Y6 N' S0 v; j c) U ; ^4 P. H8 F, g8 ^ 9 F8 t, K$ P0 F 0 _7 }! Q# a7 w5 M& b8 ~总而言之:在具有两个类的统计分类问题中,决策边界或决策表面是超平面,其将基础向量空间划分为两个集合,一个集合。 分类器将决策边界一侧的所有点分类为属于一个类,而将另一侧的所有点分类为属于另一个类。 z$ _6 i* ]! W& n7 B6 r
) { O3 U7 N$ p9 D1 z [
支持向量(support vector) + q2 R) u1 S$ y$ \8 ~ ! \; Q& A! {7 A" w7 `在了解了超平面和决策边界我们发现SVM的核心任务是找到一个超平面作为决策边界。那么满足该条件的决策边界实际上构造了2个平行的超平面作为间隔边界以判别样本的分类:- P6 R4 W: W; [& V
- u% F0 |4 t) k$ O
; O+ P- ~9 A! s$ A! D1 |0 W) x 0 U5 z. G8 z' r7 ~6 @1 B, }/ T5 f, I- N* E
3 D6 Y# J7 R5 B) D核方法; l; u2 t4 h, s* P, c; h, p8 j
9 D0 z6 i/ {# n
; `+ A7 h X ^1 `) k1 F
& k# {) ~6 Z2 R0 i- L. d. a% C: G; R, h: d
. q" G d8 R o& c8 e$ n ^7 R
以回避内积的显式计算。9 W- e* w- F |3 j
) W+ Q3 g" G a. S3 k: G( D5 }常见的核函数:, m" ~) a* m, W