数学建模社区-数学中国

标题: 小白之怒 主成分分析法与因子分析法的区别 [打印本页]

作者: Reciprocal    时间: 2014-8-23 15:19
标题: 小白之怒 主成分分析法与因子分析法的区别
请问大神们,这两种分析法的本质区别在什么地方,感觉两者好相似

作者: madio    时间: 2014-8-23 16:02
这个是关键的问题,我之前解答了多次了,二者虽然都是降维,但是主成分分析是舍去了一些影响不大的变量,这样做到了降维,而因子分析是将一些变量进行了组合,形成了一些有实际意义的隐变量,这样做到了降维。二者的效果是一样的,但是思路不同。
作者: madio    时间: 2014-8-23 16:04
这个是关键的问题,我之前解答了多次了,二者虽然都是降维,但是主成分分析是舍去了一些影响不大的变量,这样做到了降维,而因子分析是将一些变量进行了组合,形成了一些有实际意义的隐变量,这样做到了降维。二者的效果是一样的,但是思路不同。
作者: Reciprocal    时间: 2014-8-23 16:16
madio 发表于 2014-8-23 16:04
这个是关键的问题,我之前解答了多次了,二者虽然都是降维,但是主成分分析是舍去了一些影响不大的变量,这 ...

对了这两种方法有什么不足
作者: 袁海亮    时间: 2014-8-23 16:59
主成分分析
主成分分析的简介:
在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。
主成分分析的原理
设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。
主成分分析的案例
例1:评价影视作品
例2:选择旅游地
例3:2002年全国大学生数学建模竞赛B题:层次分析法在彩票抽奖
方案选择中的应用
主成分分析的应用
应用领域:经济计划和管理,能源政策和分配,人才选拔和评价,生产决策,交通运输,科研选题,产业结构,教育,医疗,环境,军事等。
处理问题类型:决策、评价、分析、预测等。
建立层次分析结构模型是关键一步,要有主要决策层参与。
构造成对比较阵是数量依据,应由经验丰富、判断力强的专家给出。
主成分分析属于因子分析的一种,利用主成分分析得到的成分之间不相关,将数据标准化之后,进行主成分分析,利用得到的成分进行多元线性回归分析,可以很好的避免由于数据问题,造成多元回归分析结果不合理。
因子分析
如何从众多相关的指标中找出少数几个综合性指标来反映原来指标包含的主要信息,这就需要进行因子分析,它是少数几个因子来描述许多指标或因素之间的联系,即:用少数几个因子反映原始数据的大部分信息的统计方法。
因子分析的方法约有10多种,如重心法、影像分析法,最大似然解、最小平方法、阿尔发抽因法、拉奥典型抽因法等等。这些方法本质上大都属近似方法,是以相关系数矩阵为基础的,所不同的是相关系数矩阵对角线上的值,采用不同的共同性□2估值。在社会学研究中,因子分析常采用以主成分分析为基础的反覆法。
重心法:是一种设置单个厂房或仓库的方法,这种方法主要考虑的因素是现有设施之间的距离和要运输的货物量,经常用于中间仓库或分销仓库的选择。商品运输量是影响商品运输费用的主要因素,仓库尽可能接近运量较大的网点,从而使较大的商品运量走相对较短的路程,就是求出本地区实际商品运量的重心所在的位置。
最大似然解:是一种统计方法,它用来求一个样本集的相关概率密度函数的参数。
最小平方法:又称最小二乘法,是一种数学优化技术,它通过最小化误差的平方和找到一组数据的最佳函数匹配。最小二乘法是用最简的方法求得一些绝对不可知的真值,而令误差平方之和为最小。 最小二乘法通常用于曲线拟合。很多其他的优化问题也可通过最小化能量最大化熵用最小二乘形式表达。
因子分析的定义
因子分析是指研究从变量群中提取共性因子的统计技术。其可在许多变量中找出隐藏的具体代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间的关系假设。基本思想是:根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量不相关或相关性较低,每组变量代表一个基本结构一即公共因子。
因子分析的应用
在多元统计中,经常遇到诸多变量之间存在强相关的问题,它会对分析带来许多困难。通过因子分析,也可以找出几个较少的有实际意义的因子,反映出原来数据的基本结构。例如:调查汽车配件的价格中,通过因子分析从20个指标中概括出原材料供应商、配件厂商、新进入者、后市场零部件厂商、整车厂和消费者6个基本指标。从而找出企业配件价格起决定性作用的几个指标。
因子分析的优、缺点:
(1)优点:它不是对原有变量的取舍,而是根据原始变量的信息进行重新组合,找出影响变量的共同因子,化简数据;它是通过旋转使得因子变量更具有可解释性,命名清晰性高。
(2)缺点:在计算因子得分时,采用的是最小二乘法,此法有事可能会失效。
与主成分分析的区别与联系:
(1)因子分析、主成分分析都是重要的降维方法(数据简化技术),因子分析可以视为主成分分析的推广和发展。
(2)主成分分析不能作为一个模型来描述,它只能作为一般的变量变换,主成分是可观测的原始变量的线性组合;因子分析需要构造因子模型,公共因子是潜在的不可观察的变量,一般不能表示为原始变量的线性组合,因子分析是用潜在的不可观测的变量和随机影响变量的线性组合来表示原始变量,即通过这样的分解来分析原始变量的协方差结构(相依关系)。
用过因子分析,可以找出少数的几个因子来代替的变量做回归分析、聚类分析、判别分析等。

作者: Reciprocal    时间: 2014-8-23 17:01
袁海亮 发表于 2014-8-23 16:59
主成分分析主成分分析的简介:在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人 ...

给力啊,谢谢你的解答
作者: 袁海亮    时间: 2014-8-23 17:03
Reciprocal 发表于 2014-8-23 17:01
给力啊,谢谢你的解答

不谢,好好加油备战!!
作者: yes3000    时间: 2015-7-15 19:07


作者: 吃香蕉除黑眼圈    时间: 2015-7-15 20:48


作者: 洛桑曲旦    时间: 2015-7-23 14:14
http://pan.baidu.com/s/1gdzZZO3





欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5