首先,通过随机生成高斯分布的样本点,构建了一个包含600个点的样本集合X,其中前300行属于第一类(Label 1),后300行属于第二类(Label 2)。
通过绘图展示了初始样本分布图,并用红色和蓝色表示两个不同的类别。
接下来的代码段中包含了一个循环,该循环以K次为限制条件,对样本集合进行压缩。其中,每次循环将样本集合Xcur划分为s个子集,并利用最近邻算法将部分样本点从子集中删除,直到满足循环停止条件。
经过压缩后的样本集合再次根据类别进行分类,并绘制了"剪辑后样本分布图",展示了处理后的样本点的分布情况。
接着,代码中实现了一个样本压缩过程,在该过程中,根据最近邻算法将不必要的样本点删除,从而实现样本压缩的目的。
最后,根据压缩后的样本点,再次根据类别进行分类,并绘制了"压缩后样本分布图",同时限定了坐标轴范围,展示了最终压缩后的样本点的分布。
+ N) { X/ `/ I- P+ d