QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1865|回复: 5
打印 上一主题 下一主题

主成分分析与聚类

[复制链接]
字体大小: 正常 放大
亚澈        

3

主题

7

听众

65

积分

升级  63.16%

  • TA的每日心情
    郁闷
    2014-7-27 21:37
  • 签到天数: 20 天

    [LV.4]偶尔看看III

    自我介绍
    热爱数学,享受生活
    跳转到指定楼层
    1#
    发表于 2013-8-17 09:41 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
         感觉主成分分析与聚类是一样的,都是降维吗,两个什么情况下会一起用啊??跪谢!!
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    袁海亮     中国数模人才认证   

    148

    主题

    160

    听众

    2万

    积分

  • TA的每日心情
    难过
    2021-12-27 17:15
  • 签到天数: 337 天

    [LV.8]以坛为家I

    2013挑战赛参赛者

    社区QQ达人 元老勋章 发帖功臣 新人进步奖 优秀斑竹奖 金点子奖 原创写作奖 最具活力勋章 助人为乐奖 风雨历程奖

    群组2013年第二期美赛论文

    群组2013年国赛赛前培训

    群组网络挑战赛一阶段C题

    群组2013年数学建模国赛备

    群组有事没事来点事做

    聚类分析
    聚类分析的定义
    聚类分析又称群分析,是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,它们讨论的对象是大量的样品,要求能合理地按各自的特性来进行合理的分类,没有任何模式可供参考或依循,即使在没有先验知识的情况下进行的。
    聚类分析的主要应用
    1、在商业上
    聚类分析被用来发现不同的客户群,并且通过购买模式刻画不同的客户群的特征。
    2、在生物上
    聚类分析被用来动植物分类和对基因进行分类,获取对种群固有结构的认识 。
    3、在地理上
    聚类能够帮助在地球中被观察的数据库商趋于的相似性。
    4、 在保险行业上
    聚类分析通过一个高的平均消费来鉴定汽车保险单持有者的分组,同时根据住宅类型,价值,地理位置来鉴定一个城市的房产分组。
    5、在因特网应用上
    聚类分析被用来在网上进行文档归类来修复信息。
    6、在电子商务上
    聚类分析在电子商务中网站建设数据挖掘中也是很重要的一个方面,通过分组聚类出具有相似浏览行为的客户,并分析客户的共同特征,可以更好的帮助电子商务的用户了解自己的客户,向客户提供更合适的服务。
    聚类分析的特征
    聚类分析时根据事物本身的特性研究个体的一种方法,目的在于将相似的事物归类。它的原则是同一类中的个体有较大的相似性,不同类的个体差异性很大。这种方法有三个特征:
    (1)适用于没有先验知识的分类。如果没有这些事先的经验或一些国际标准、国内标准、行业标准,分类便会显得随意和主观。这时只要设定比较完善的分类变量,就可以通过聚类分析法得到较为合理的类别。
    (2)可以处理多个变量决定的分类。例如,要根据消费者购买量的大小进行分类比较容易,但如果在进行数据挖掘时,要求根据消费者的购买量、家庭收入、家庭支出、年龄等多个指标进行分类通常比较复杂,而聚类分析法可以解决这类问题。
    (3)聚类分析法是一种探索性分析方法,能够分析事物的内在特点和规律,并根据相似性原则对事物进行分组,是数据挖掘中常用的一种技术。
    聚类分析的优缺点
    1、优点:聚类分析模型的优点就是直观,结论形式简明。
    2、缺点
      (1)在样本量较大时,要获得聚类结论有一定困难。由于相似系数是很据实验对象的反映来建立反映实验对象间内在联系的指标,而实践中有时尽管从实验对象反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,要根据专业知识来分析聚类分析的结果。
      (2)聚类结果要明确就需分离度很好的数据。几乎所有现存的算法都是从相互区别的不重叠的类数据中产生同样的聚类。但是,如果类是扩散且互相渗透,那么每种算法的结果将有所不同。结果,每种算法界定的边界不清,每种聚类算法得到各自的最适结果,每个数据部分将产生单一的信息。为解释来自任一算法使同样数据产生不同结果,必须注意判断不同的方式。
    主成分分析
    主成分分析的简介:
    在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。
    主成分分析的原理
    设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。

    主成分分析的案例
    例1:评价影视作品
    例2:选择旅游地
    例3:2002年全国大学生数学建模竞赛B题:层次分析法在彩票抽奖
    方案选择中的应用
    主成分分析的应用
    应用领域:经济计划和管理,能源政策和分配,人才选拔和评价,生产决策,交通运输,科研选题,产业结构,教育,医疗,环境,军事等。
    处理问题类型:决策、评价、分析、预测等。
    建立层次分析结构模型是关键一步,要有主要决策层参与。
    构造成对比较阵是数量依据,应由经验丰富、判断力强的专家给出。
    主成分分析属于因子分析的一种,利用主成分分析得到的成分之间不相关,将数据标准化之后,进行主成分分析,利用得到的成分进行多元线性回归分析,可以很好的避免由于数据问题,造成多元回归分析结果不合理。
    回复

    使用道具 举报

    亚澈        

    3

    主题

    7

    听众

    65

    积分

    升级  63.16%

  • TA的每日心情
    郁闷
    2014-7-27 21:37
  • 签到天数: 20 天

    [LV.4]偶尔看看III

    自我介绍
    热爱数学,享受生活
      很详细  好像明白一点了   是不是聚类主观性比较强   不够准确   主成分相对避免了这种情况

    点评

    袁海亮  结果准不准确 在你的降维处理过程中因素决定的  详情 回复 发表于 2013-8-17 15:46
    回复

    使用道具 举报

    袁海亮     中国数模人才认证   

    148

    主题

    160

    听众

    2万

    积分

  • TA的每日心情
    难过
    2021-12-27 17:15
  • 签到天数: 337 天

    [LV.8]以坛为家I

    2013挑战赛参赛者

    社区QQ达人 元老勋章 发帖功臣 新人进步奖 优秀斑竹奖 金点子奖 原创写作奖 最具活力勋章 助人为乐奖 风雨历程奖

    群组2013年第二期美赛论文

    群组2013年国赛赛前培训

    群组网络挑战赛一阶段C题

    群组2013年数学建模国赛备

    群组有事没事来点事做

    本帖最后由 袁海亮 于 2013-8-17 15:47 编辑
    亚澈 发表于 2013-8-17 15:28
    很详细  好像明白一点了   是不是聚类主观性比较强   不够准确   主成分相对避免了这种情况

    结果准不准确 在你的降维处理过程中所选取的因素决定的

    点评

    袁海亮  是的  详情 回复 发表于 2013-8-17 18:40
    亚澈  是说我可以人为地规定聚类聚成几类 或者主成分选取几个吗 这些都会造成一定的不确定性吧  发表于 2013-8-17 16:18
    回复

    使用道具 举报

    magic2728 实名认证    中国数模人才认证   

    61

    主题

    478

    听众

    4861

    积分

    升级  95.37%

  • TA的每日心情
    慵懒
    2014-9-29 19:37
  • 签到天数: 409 天

    [LV.9]以坛为家II

    群组数学中国 2015美赛护航

    群组数模专题强化培训

    群组建模思维养成培训

    群组2015美赛护航(强化)

    群组2013年数学建模国赛备

    聚类分析是用来把多个确定的对象进行分类用的,主成分是对多变量问题进行减少变两个数的操作,进而实现问题的化简。
    回复

    使用道具 举报

    袁海亮     中国数模人才认证   

    148

    主题

    160

    听众

    2万

    积分

  • TA的每日心情
    难过
    2021-12-27 17:15
  • 签到天数: 337 天

    [LV.8]以坛为家I

    2013挑战赛参赛者

    社区QQ达人 元老勋章 发帖功臣 新人进步奖 优秀斑竹奖 金点子奖 原创写作奖 最具活力勋章 助人为乐奖 风雨历程奖

    群组2013年第二期美赛论文

    群组2013年国赛赛前培训

    群组网络挑战赛一阶段C题

    群组2013年数学建模国赛备

    群组有事没事来点事做

    袁海亮 发表于 2013-8-17 15:46
    结果准不准确 在你的降维处理过程中所选取的因素决定的

    是的
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-11 06:36 , Processed in 0.411284 second(s), 82 queries .

    回顶部