数学建模社区-数学中国
标题: 支持向量机(SVM)分类器(matlab实现) [打印本页]
作者: 2744557306 时间: 2023-8-19 16:41
标题: 支持向量机(SVM)分类器(matlab实现)
支持向量机(Support Vector Machine,SVM)是一种常用的监督学习算法,广泛应用于模式识别、分类和回归分析等领域。SVM 的主要目标是找到一个最优的超平面来对数据进行划分,并实现在非线性情况下的高效分类。
通俗地说,我们可以想象 SVM 是一个将不同类别的数据点分隔开的分割线(二维平面)或超平面(高维空间)。SVM基于训练集中的样本点,通过寻找最优的分割线或超平面来实现分类。这里的最优意味着,将不同类别的样本点分隔得尽可能宽,以提高对新样本的泛化能力。分割线或超平面两侧的数据点被称为支持向量,它们对分类决策起到重要作用。
6 U8 ] z: S6 G' X. j q这段代码是一个简单的支持向量机(SVM)分类器的示例。代码使用了名为 "heart_scale" 的数据集,首先将数据集分为训练集和测试集,然后利用SVM模型对测试集进行分类,并将结果与实际标签进行对比。为了可视化高维数据,代码还使用了多维缩放(MDS)将数据从13维降低到2维。
9 a4 p( z! Z$ s: a" V& |& z4 U- G首先,代码读取 "heartscale" 数据集,其中包括标签(heartscalelabel)和特征向量(heartscale_inst)。然后确定训练集和测试集的索引,并将数据分成相应的部分。. [; ^" r# C& D& v# \; S" y
接下来,代码使用训练集数据(trainData)和标签(trainLabel)训练SVM模型。然后使用训练好的模型对测试集数据(testData)进行分类,得到预测标签(predictlabel)、准确率(accuracy)和类别概率值(probvalues)。% ^6 ?7 T( j. @' d5 c0 V6 P
代码的下一部分是为每个类别分配颜色。根据数据集标签的值,将其转换为类别索引,然后使用预先定义的颜色列表(colorList)为每个类别确定颜色。1 ~7 H% V, o5 Z' z+ y' p
通过多维缩放(MDS),代码将原始的13维特征向量降低到2维。首先,通过计算特征向量间的欧氏距离(distanceMatrix),得到距离矩阵。然后,将距离矩阵作为输入,使用MDS将特征向量降低到2维,得到新的坐标(newCoor)。3 f* z: y9 j- U) E8 c
最后,代码使用散点图展示结果。首先,在整个数据集上绘制散点图,并根据真实类别(colorTrueClass)为每个数据点上色。然后,绘制测试集的散点图,并根据真实类别(colorTrueClassPlot)和预测类别(colorResultClass)分别为数据点上色。最后,绘制训练集的散点图,并根据真实类别(colorTrueClassPlot)为数据点上色。
1 O( c; ?! L4 ~, h! ^
* J" R& h' Y, v$ c, @3 D# s当然,我会逐行解释以下代码的功能和作用。
. Q- ^1 z6 t, Xclear& D( O% O) [: g7 }9 w3 ^$ x
clc
\! j n+ ]/ _- |) C% S* sclose all
- d/ ~* C3 X/ I+ [% u! s0 d( b' H5 V- |
这些行代码用于清除MATLAB工作区域中的变量,清除命令行窗口上的内容,并关闭所有打开的图形窗口。% I0 _7 x# n* z V! l
[heart_scale_label, heart_scale_inst] = libsvmread('heart_scale');
# k+ w0 I3 _- f: d+ @3 b[N,D] = size(heart_scale_inst);
$ \6 F1 S/ Y% ~( n0 i3 H+ F& O
这两行代码读取文件 heart_scale 中的数据并将其分配给变量 heart_scale_label 和 heart_scale_inst。heart_scale_label 是数据的标签,而 heart_scale_inst 是数据的特征或属性。[N,D] = size(heart_scale_inst) 用于获取 heart_scale_inst 的大小,其中 N 是数据点的数量,D 是每个数据点的特征维度。
5 {0 q+ i& D0 V' rtrainIndex = zeros(N,1); trainIndex(1:200) = 1;
7 f4 ?( b H" U6 ?6 etestIndex = zeros(N,1); testIndex(201:N) = 1;
5 d$ I& K; |! I- Q5 c5 etrainData = heart_scale_inst(trainIndex==1,
;
* Y1 A; P/ t# { @" otrainLabel = heart_scale_label(trainIndex==1,
;
( a" u; E7 H9 l) EtestData = heart_scale_inst(testIndex==1,
;1 f2 d- H$ Z- B( W0 C6 P. k
testLabel = heart_scale_label(testIndex==1,
;
& P7 n4 P6 T/ ?/ q O. L# K( ]9 k; j, u9 a- \% }
这部分代码定义了训练集和测试集的索引,并使用这些索引将数据划分为相应的部分。首先,通过创建一个大小为 N 的零向量 trainIndex 和 testIndex,将训练集和测试集的索引位置标记为1。然后,使用这些索引从 heart_scale_inst 和 heart_scale_label 中选择相应的数据点和标签,形成训练集数据 (trainData)、训练集标签 (trainLabel)、测试集数据 (testData) 和测试集标签 (testLabel)。
& e# ]5 i/ s0 }5 ]9 e" d; W3 {! jmodel = svmtrain(trainLabel, trainData, '-c 1 -g 0.07 -b 1');
1 t+ _0 Q5 T8 p+ G# M! k* w7 e[predict_label, accuracy, prob_values] = svmpredict(testLabel, testData, model, '-b 1');* ~! ?8 |0 ^4 e/ Z0 U' I- V
4 Z: j4 E% H- |
这部分代码使用支持向量机 (SVM) 进行训练和测试。首先,使用 svmtrain 函数训练一个SVM模型,其中训练集标签 (trainLabel) 和训练集数据 (trainData) 作为输入。额外的参数 -c 1 -g 0.07 -b 1 是SVM的参数设置,其中 -c 是惩罚项系数,-g 是高斯核函数的参数,-b 启用概率输出。训练完成后,得到一个训练好的模型 (model)。, e6 L( }* U1 g9 l' ^
然后,使用 svmpredict 函数根据 model 对测试集数据 (testData) 进行预测,并将预测标签 (predict_label)、准确率 (accuracy) 和类别概率值 (prob_values) 分别赋值给相应的变量。0 W# P0 S- s! [; C% u
colorList = prism(100);
( r( H) S. j) c: jtrueClassIndex = zeros(N,1);
7 j4 l% ~( f3 g. W; n6 M, Q& ptrueClassIndex(heart_scale_label==1) = 1;
( F( M: b+ d+ @, \0 `trueClassIndex(heart_scale_label==-1) = 2;
: t" K7 O2 c9 ~4 WcolorTrueClass = colorList(trueClassIndex,
;( g. T% U6 y) j: V
resultClassIndex = zeros(length(predict_label),1);
$ r: W/ `( G2 presultClassIndex(predict_label==1) = 1;3 F; H J7 Q2 O3 H+ Q
resultClassIndex(predict_label==-1) = 2;
* G. y. e+ H' H& o) ?colorResultClass = colorList(resultClassIndex,
;
+ m" T0 N* y3 C4 p+ Q. `$ z/ W; ?4 u: r! G5 J! Q$ _8 F: D
这部分代码用于为每个类别分配颜色。通过 prism(100) 函数创建一个颜色映射列表 colorList。然后,根据原始数据的标签 (heart_scale_label),将标签为1的数据点的索引标记为1,标签为-1的数据点的索引标记为2。根据这些索引,从 colorList 中选择相应的颜色,得到真实类别的颜色 (colorTrueClass)。类似地,使用预测标签 (predict_label) 创建结果类别的颜色 (colorResultClass)。) i4 p) n4 K* s$ c: C
distanceMatrix = pdist(heart_scale_inst,'euclidean');* f- J( S8 O2 W' a0 P/ @/ e, X
newCoor = mdscale(distanceMatrix,2);9 Y" ?6 x, p+ l f
9 h2 C# D+ x& w6 F
这部分代码计算了原始数据点之间的欧氏距离矩阵 (distanceMatrix),并将其作为输入传递给 mdscale 函数。mdscale 函数将高维特征向量 (13D) 降维到2维,并返回新的二维坐标 (newCoor)。
5 \7 C# f. n- jx = newCoor(:,1);
* [4 W6 p1 }$ ~& \ s8 hy = newCoor(:,2);) M& U1 ?; x: ^9 _* [+ T: e
patchSize = 30;7 ^9 Q+ `* ]+ N. o$ z. P
colorTrueClassPlot = colorTrueClass;
E0 \" }- ]; @figure; scatter(x,y,patchSize,colorTrueClassPlot,'filled');4 T+ q6 T6 a' F" o
title('whole data set');
! v) j8 P- E2 G# j% q9 f/ `! m+ q0 M; v6 i
这部分代码用于绘制整个数据集的散点图。首先,将新的坐标中的第一列 (x) 和第二列 (y) 分别赋值给变量。然后,根据真实类别的颜色 (colorTrueClassPlot),使用 scatter 函数绘制散点图,并设置散点的大小为 patchSize。最后,通过 title 函数给图像添加标题。
' T1 j u* R5 A* {( tx = newCoor(testIndex==1,1);. ]8 B+ H3 t z, H
y = newCoor(testIndex==1,2);
8 L1 Q- F+ [# D3 g" C( ppatchSize = 80*max(prob_values,[],2);
) I( t0 g; j9 m6 Y( a1 @" icolorTrueClassPlot = colorTrueClass(testIndex==1,
;
$ }5 E0 ?& v* V7 r4 Zfigure; hold on;
) e$ @6 B9 u9 \6 W+ mscatter(x,y,2*patchSize,colorTrueClassPlot,'o','filled'); P- A# m' B+ k |
scatter(x,y,patchSize,colorResultClass,'o','filled');
$ K% ]2 [ c! {1 I) J) Y2 j3 U6 ix = newCoor(trainIndex==1,1);2 }( ^% l1 W# b; r
y = newCoor(trainIndex==1,2);
1 i4 \$ E$ `, U0 V: q# kpatchSize = 30;
7 Z" l6 m$ Y5 R U& N& I) zcolorTrueClassPlot = colorTrueClass(trainIndex==1,
;4 A0 y k! E0 s' S p5 X0 p
scatter(x,y,patchSize,colorTrueClassPlot,'o');
+ s0 |4 Z! K9 x# etitle('classification results');
& w( G+ g" B$ C+ t: _( [7 K. o+ c
, f: h1 O8 n/ E- m, D$ t这部分代码用于绘制分类结果的散点图。首先,将测试集的新坐标 (newCoor) 中仅包含测试数据的部分的第一列 (x) 和第二列 (y) 赋值给 x 和 y 变量。然后,根据真实类别的颜色 (colorTrueClassPlot) 使用 scatter 函数绘制测试数据的散点图,设置散点的大小为 patchSize 的2倍,并使用真实类别的颜色填充。接下来,再次使用 scatter 函数绘制测试数据的散点图,散点的大小为 patchSize,颜色根据预测的类别 (colorResultClass) 填充。最后,将训练集数据的散点图绘制在图像上,同样使用真实类别的颜色填充。通过 title 函数给图像添加标题。
$ V, D$ B4 d% v" R希望这些逐行解释能够帮助您理解代码的功能和作用。如果还有其他问题,请随时提问。
* s: u$ m! D0 {% Y; z' x/ ~& w; O7 l' C/ X: X; g+ b1 h B
+ G0 ]( Q6 ?- H, X; W% \% a- ~; e/ `# @
-
-
SVM.rar
6.37 KB, 下载次数: 0, 下载积分: 体力 -2 点
售价: 3 点体力 [记录]
[购买]
| 欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) |
Powered by Discuz! X2.5 |