浅夏110 发表于 2020-5-26 15:29

模糊聚类分析方法

在工程技术和经济管理中,常常需要对某些指标按照一定的标准(相似的程度或亲 疏关系等)进行分类处理。例如,根据生物的某些性态对其进行分类,根据空气的性质 对空气质量进行分类,以及工业上对产品质量的分类、工程上对工程规模的分类、图像 识别中对图形的分类、地质学中对土壤的分类、水资源中的水质分类等等。这些对客观 事物按一定的标准进行分类的数学方法称为聚类分析,它是多元统计“物以聚类”的一种分类方法。然而,在科学技术、经济管理中有许多事物的类与类之间并无清晰的划分, 边界具有模糊性,它们之间的关系更多的是模糊关系。对于这类事物的分类,一般用模糊数学方法、我们把应用模糊数学方法进行的聚类分析,称为模糊聚类分析。

1 预备知识
1.1 模糊等价矩阵

https://img-blog.csdnimg.cn/20190506233006868.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70


n 阶等价布尔矩阵

https://img-blog.csdnimg.cn/2019050623314111.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

模糊分类

https://img-blog.csdnimg.cn/20190506233152674.png

https://img-blog.csdnimg.cn/20190506233237195.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

https://img-blog.csdnimg.cn/20190506233307834.png

https://img-blog.csdnimg.cn/20190506233320321.png


1.2 模糊相似矩阵

https://img-blog.csdnimg.cn/20190506233419500.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

https://img-blog.csdnimg.cn/2019050623344189.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

https://img-blog.csdnimg.cn/20190506233526228.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70


2 模糊聚类分析法的基本步骤
Step1: 数据标准化

(1) 获取数据

https://img-blog.csdnimg.cn/2019050623361127.png

(2) 数据的标准化处理
在实际问题中,不同的数据可能有不同的性质和不同的量纲,为了使原始数据能够 适合模糊聚类的要求,需要将原始数据矩阵 A 作标准化处理,即通过适当的数据变换,将其转化为模糊矩阵。常用的方法有以下两种:

① 平移—标准差变换

https://img-blog.csdnimg.cn/20190506233729496.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

② 平移—极差变换

https://img-blog.csdnimg.cn/20190506233750524.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

Step2: 建立模糊相似矩阵

https://img-blog.csdnimg.cn/20190506233833891.png

(1) 数量积法

https://img-blog.csdnimg.cn/20190506233902550.png
https://img-blog.csdnimg.cn/20190506233930385.png

(2) 夹角余弦法

https://img-blog.csdnimg.cn/20190506234026747.png

(3) 相关系数法

https://img-blog.csdnimg.cn/20190506234047403.png

(4) 指数相似系数法

https://img-blog.csdnimg.cn/20190506234120409.png

(5) 最大最小值法
                  式中 ∧ 为取小运算min,∨ 代表取大运算max
https://img-blog.csdnimg.cn/20190506234159384.png


(6) 算术平均值法

https://img-blog.csdnimg.cn/20190506234232597.png

(7) 几何平均值法

https://img-blog.csdnimg.cn/20190506234758300.png

(8) 绝对值倒数法

https://img-blog.csdnimg.cn/20190506234529441.png

(9) 绝对值指数法

https://img-blog.csdnimg.cn/20190506234840580.png

(10) 海明距离法

https://img-blog.csdnimg.cn/20190506234900186.png

(11) 欧氏距离法

https://img-blog.csdnimg.cn/20190506235143242.png

(12) 切比雪夫距离法

https://img-blog.csdnimg.cn/20190506235644660.png

(13) 主观评分法

https://img-blog.csdnimg.cn/20190506235303561.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

Step3: 聚类
所谓聚类方法就是依据模糊矩阵将所研究的对象进行分类的方法。对于不同的置信 水平λ ∈,可以得到不同的分类结果,从而形成动态聚类图。常用的方法如下:

(1) 传递闭包法
从 Step2 中求出的模糊相似矩阵 R 出发,来构造一个模糊等价矩阵  。其方法就 是用平方法求出 R 的传递闭包t(R) ,则  t(R) =  ;然后,由大到小取一组λ ∈ , 确定相应的λ 截矩阵,则可以将其分类,同时也可以构成动态聚类图。

(2) 布尔矩阵法

https://img-blog.csdnimg.cn/20190506235744862.png

https://img-blog.csdnimg.cn/20190506235809470.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

(3) 直接聚类法
此方法是直接由模糊相似矩阵求出聚类图的方法,具体步骤如下:

https://img-blog.csdnimg.cn/20190506235850445.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

3 模糊聚类分析应用案例
例 15 某地区内有 12 个气象观测站,10 年来各站测得的年降水量如表 3 所示。 为了节省开支,想要适当减少气象观测站,试问减少哪些观察站可以使所得到的降水量 信息仍然足够大?

https://img-blog.csdnimg.cn/20190507000154634.png

https://img-blog.csdnimg.cn/20190507000032864.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

解 我们把 12 个气象观测站的观测值看成 12 个向量组,由于本题只给出了 10 年 的观测数据,根据线性代数的理论可知,若向量组所含向量的个数大于向量的维数,则 该向量组必然线性相关。于是只要求出该向量组的秩就可确定该向量组的最大无关组所 含向量的个数,也就是需保留的气象观测站的个数。由于向量组中的其余向量都可由极 大线性无关组线性表示,因此,可以使所得到的降水信息量足够大。

https://img-blog.csdnimg.cn/20190507082055579.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

到目前为止,问题似乎已经完全解决了,可其实不然,因为如果上述观测站的数 据不是 10 年,而是超过 12 年,则此时向量的维数大于向量组所含的向量个数,这样的 向量组未必线性相关。故上述的解法不具有一般性,下面我们考虑一般的解法,首先, 我们利用已有的 12 个气象观测站的数据进行模糊聚类分析,最后确定从哪几类中去掉 几个观测站。

(1)建立模糊集合

https://img-blog.csdnimg.cn/20190507082136504.png

https://img-blog.csdnimg.cn/20190507082200274.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70
https://img-blog.csdnimg.cn/20190507082225338.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

(2)利用格贴近度建立模糊相似矩阵

https://img-blog.csdnimg.cn/20190507082317988.png

(3)求 R 的传递闭包

https://img-blog.csdnimg.cn/20190507082408110.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

其余观测站属于中间水平。

(4)选择保留观测站的准则
显然,去掉的观测站越少,则保留的信息量越大。为此,我们考虑在去掉的观测 站数目确定的条件下,使得信息量最大的准则。由于该地区的观测站分为 4 类,且第 4 类只含有一个观测站,因此,我们从前 3 类中各去掉一个观测站,我们的准则如下:

https://img-blog.csdnimg.cn/2019050708245424.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

https://img-blog.csdnimg.cn/20190507082513285.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

https://img-blog.csdnimg.cn/20190507082529251.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzI5ODMxMTYz,size_16,color_FFFFFF,t_70

(5)求解的 MATLAB 程序如下:

i)求模糊相似矩阵的 MATLAB 程序

a=[276.2 324.5 158.6 412.5 292.8 258.4 334.1 303.2 292.9 243.2 159.7 331.2
251.5 287.3 349.5 297.4 227.8 453.6 321.5 451.0 466.2 307.5 421.1 455.1
192.7 433.2 289.9 366.3 466.2 239.1 357.4 219.7 245.7 411.1 357.0 353.2
246.2 232.4 243.7 372.5 460.4 158.9 298.7 314.5 256.6 327.0 296.5 423.0
291.7 311.0 502.4 254.0 245.6 324.8 401.0 266.5 251.3 289.9 255.4 362.1
466.5 158.9 223.5 425.1 251.4 321.0 315.4 317.4 246.2 277.5 304.2 410.7
258.6 327.4 432.1 403.9 256.6 282.9 389.7 413.2 466.5 199.3 282.1 387.6
453.4 365.5 357.6 258.1 278.8 467.2 355.2 228.5 453.6 315.6 456.3 407.2
158.2 271.0 410.2 344.2 250.0 360.7 376.4 179.4 159.2 342.4 331.2 377.7
324.8 406.5 235.7 288.8 192.6 284.9 290.5 343.7 283.4 281.2 243.7 411.1];
mu=mean(a),sigma=std(a)
for i=1:12
    for j=1:12
        r(i,j)=exp(-(mu(j)-mu(i))^2/(sigma(i)+sigma(j))^2);
    end
end
r
save data1 r a

ii)矩阵合成的 MATLAB 函数

function rhat=hecheng(r);
n=length(r);
for i=1:n
    for j=1:n
        rhat(i,j)=max(min());
    end
end

iii)求模糊等价矩阵和聚类的程序

load data1
r1=hecheng(r)
r2=hecheng(r1)
r3=hecheng(r2)
bh=zeros(12);
bh(find(r2>0.998))=1

iv)计算表6的程序  编写计算误差平方和的函数如下:

function err=wucha(a,t);
b=a;b(:,t)=[];
mu1=mean(a,2);mu2=mean(b,2);
err=sum((mu1-mu2).^2);


计算28个方案的主程序如下:

load data1
ind1=;ind2=;ind3=;
so=[];
for i=1:length(ind1)
    for j=1:length(ind3)
        for k=1:length(ind2)
            t=;
            err=wucha(a,t);
            so=];
        end
    end
end
so
tm=find(so(:,4)==min(so(:,4)));
shanchu=so(tm,1:3)



————————————————
版权声明:本文为CSDN博主「wamg潇潇」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_29831163/article/details/89893908


页: [1]
查看完整版本: 模糊聚类分析方法