QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3220|回复: 1
打印 上一主题 下一主题

【R教程】聚类分析

[复制链接]
字体大小: 正常 放大

3503

主题

538

听众

5990

积分

  • TA的每日心情
    开心
    2017-2-7 15:12
  • 签到天数: 691 天

    [LV.9]以坛为家II

    社区QQ达人 元老勋章 发帖功臣 新人进步奖 优秀斑竹奖 金点子奖 原创写作奖 最具活力勋章 助人为乐奖 风雨历程奖

    群组2013年国赛赛前培训

    群组2014年地区赛数学建模

    群组数学中国第二期SAS培训

    群组物联网工程师考试

    群组2013年美赛优秀论文解

    跳转到指定楼层
    1#
    发表于 2016-6-15 17:13 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    聚类分析(cluster analysis)是把研究对象(样本或变量)分组成为由类似的对象组成多个类的一种统计方法。聚类结果一般在4-6类,不易太多,或太少。聚类分析目的在于将相似的事物归类,同一类中的个体有较大的相似性,不同类的个体差异性很大。两个个体间(或变量间)的对应程度或联系紧密程度的度量可以用两种方式来测量:1、采用描述个体对(变量对)之间的接近程度的指标,例如“距离”,“距离”越小的个体(变量)越具有相似性;2、采用表示相似程度的指标,例如“相关系数”,“相关系数”越大的个体(变量)越具有相似性。

    聚类分析方法包括:系统聚类法、动态聚类法、有序样本聚类法和模糊聚类法等等。本文只介绍较常用的系统聚类法和动态聚类法。
    系统聚类法

    以R基础包自带的Iris数据进行聚类分析。分析代码如下:

    ###### 代码清单 #######
    data(iris); attach(iris)
    iris.hc <- hclust( dist(iris[,1:4]))
    # plot( iris.hc, hang = -1)
    plclust( iris.hc, labels = FALSE, hang = -1)
    re <- rect.hclust(iris.hc, k = 3)
    iris.id <- cutree(iris.hc, 3)
    table(iris.id, Species)

    ###### 运行结果 #######
    > table(iris.id,Species)
    Species
    iris.id setosa versicolor virginica
    1 50 0 0
    2 0 23 49
    3 0 27 1
    聚类分析生成的图形如下:
    6407.jpg (9.28 KiB) 查看 112 次

    鸢尾花花萼及花瓣的长度和宽度系统聚类图

    结果表明,函数cuttree()将数据iris分类结果iris.hc编为三组分别以1,2, 3表示,保存在iris.id中。将iris.id与iris中Species作比较发现:1应该是setosa类,2应该是virginica类(因为virginica的个数明显多于versicolor),3是versicolor。
    动态聚类法

    仍以R基础包自带的鸢尾花(Iris)数据进行K-均值聚类分析,分析代码如下:

    ###### 代码清单 #######
    library(fpc)
    data(iris)
    df<-iris[,c(1:4)]
    set.seed(252964) # 设置随机值,为了得到一致结果。

    (kmeans <- kmeans(na.omit(df), 3)) # 显示K-均值聚类结果

    plotcluster(na.omit(df), kmeans$cluster) # 生成聚类图
    生成的图如下:


    动态聚类结果

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    dhy826        

    0

    主题

    12

    听众

    48

    积分

    升级  45.26%

  • TA的每日心情
    开心
    2016-9-24 12:54
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    社区QQ达人

    群组2016好贷杯赛前培训

    群组2016研赛备战群组

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-9-25 09:57 , Processed in 0.671683 second(s), 57 queries .

    回顶部