由表10.2,变量x1、x2、x3三个变量彼此间的相关性很强,而变量x4与前三个变量 / u! ^1 B7 X) Q表现为负相关。9 h+ O4 E3 [& \
求解相关矩阵的特征方程,得到特征向量矩阵为: ' ]1 [! _$ b8 K) J1 D1 u$ u [img=512,124]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img], j6 D6 S9 h. K. I 相应的特征值、占总体的百分比、累计百分比如表10.3所示。& ]2 C. F' F4 L( W 表10.3特征值及百分比表 / e( S% v6 O, ~. B1 a) A% u
序号
特征值
占总体的百分比
累计百分比
1
3.0020
75.05
75.05
2
0.8941
22.35
97.40
3
0.0679
1.69
99.10
4
0.0358
0.89
100
0 s* T C6 w/ |* h$ Y; o% Z; h& P根据表10.3选择两个主因子(第一主因子和第二主因子),它们反映的信息量已占7 v2 I3 N; |$ u
总体信息量的97.4%,即几乎完全反应了四个变量的总信息量。由此选出的两个主因子,得到因子在和矩阵为· 7 c, [0 y. w' ~/ O& ~. B[img=224,120]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img] [img=76,56]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img]9 j+ l3 f, e! G8 t6 e: V 因子模型(对特殊因子忽略不计)为: : H) J( v! o: j" `: V/ @4 G/ t[img=296,124]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img]2 N/ y3 e% x. ^& w 从因子载荷矩阵看出,第一主因子主要由前三个变量所决定,而前三个变量彼此间相关性很强,因此在作火柴销售预测时,只需选取三个变量中的任一个变量就可以了。第二个主因子主要由第四个变量所决定,该变量在主因子上的载荷为0.9213。! {) t9 v7 u+ S& y+ U 附SPSS操作说明:9 k% c( I/ k: [4 {: N' e 在Statistics菜单下选择Data Deduction,然后选择Factor过程。Factor过程的选择项共分为五类,分别使用主对话框中的五个子对话框按钮展开相应的子对话框进行选择。" @; e1 {# ]- L& T d- D+ Q
☆Descriptives展开相应的子对话框可以选择单变量的描述统计量和初始分析结果。9 P; c. j x9 z0 v
☆Extraction展开相应的子对话框可以选择不同的提取公因子的方法和控制提取结果的判据。 7 U! b' w$ @8 h- m ☆Rotation展开相应的子对话框可以选择因子旋转方法。 + S* |" V" i' d4 s: A( ] ☆Scores展开相应的子对话框可以要求计算因子得分,选择显示或作为新变量保存。 % x. s1 {- O$ B% R; A ☆Option展开相应的子对话框可以进一步选择各种输出项。 % J2 e" [2 s" F$ p+ n; K, \ 下面就这几个子对话框分别说明其中的选择项的含义或功能。 0 k5 |9 |0 e0 N' O5 X* x* ]1.Descriptives 子对话框中的选择项& V2 F+ P' F. x; e
描述统计量分的选择项为两组: 1 M% q0 H3 n/ J(1)Statistics 统计量组,共有两项供选择:4 R; a& X8 {2 B8 I
①Univariate descriptives 单变量描述统计量,选择此项可以输出参与分析的各原始变量的均值、标准差等。 ; _7 `/ a; P. B9 q- p7 U ②Initial solution 初始分析结果,选择此项可以给出原始变量的公因子方差、与变量数目相等的因子、各因子的特征值、各因子特征值占总方差的百分比以及累积百分比。 . R/ i2 D9 D" s; |(2) Corelation Matrix 相关矩阵组: b2 D8 e+ R! E6 I: x$ o& L8 A
①Coefficients 相关系数选择此项给出原始变量间的相关系数矩阵。这是分析的基础。 % B8 G ~6 j1 i/ f9 L/ `, Q. ] ②Significance levels 显著性水平选择此项给出每个相关系数相对于相关系数为0的假设检验的概率水平。 $ j" I* k0 X- z) @2 y ③Determinant 相关系数矩阵的行列式。0 d% ~: v: c- a9 M. v/ [4 [6 Q8 q2 i
④Inverse 相关系数矩阵的逆矩阵。 E5 T! T% B1 L+ z, g$ y
⑤Reproduced 再生相关阵,选择此项给出因子分析后的相关阵,还给出残差,即原始相关与再生相关之间的差值。$ I( K1 m% v5 B: h4 z+ B
⑥Anti-image 反映象相关阵。包括偏相关系数的负数;反映象协方差阵,包括偏协方差的负数;在一个好的因子模型中除对角线上的系数较大外,远离对角线的元素应该比较小。 . S `- H b" H- [. M, ? ⑦KMO and Bartlett's test of sphericity KMO和球形Bartlett检验。选择此项给出对采样充足度的Kaisex-Meyer-Olkin测度。检验变量间的偏相关是否很小。Barllet球形检验,检验的是相关阵是否是单位阵。它表明因子模型是否是不合适宜的。 4 f1 F3 S6 z9 e9 j6 E: B Continue按钮确认选择,返回主对话框;Cancel按钮使选择作废,返回主对话框。! e( b4 s! ^' R6 u 2.Extraction 因子提取子对话框0 U8 w3 y/ u! A: [! r' O3 m/ h
有关因子提取的选择项共分四部分。 % O# a3 n) I0 x6 K M(1)因子提取方法选择项 8 c. p1 i8 A' E, d" J0 O 子对话框第一项Methed:是一组指定提取方法的选择项。单击矩形框右面的箭头可以展开提取方法选择项表,提供七种提取方法可以选择: % g# i: t9 X7 D( w$ a. w ①Principal components 主成份法。该方法假设变量是因子的纯线性组合。 ' \. G* k: G& q ②Unweighted least square 不加权最小平方法。该方法使观测的和再生的相关阵之差的平方最小。/ _1 G* y( O! H1 N$ j; k' S1 {0 t
③Generalized least squares用变量的单值加权,使观测的和再生的相关阵之差的平方最小。7 h' u' Z- v5 c% R- K2 P
④Maximum likelihoud 最大似然法。此方法不要求多元正态分布。给出参数估计,如果样本来自多元正态总体它们与原始变量的相关阵极为相似。 * A! [' s; [; ~6 A. ~6 i# E$ n6 h ⑤Principal Axis factoring 使用多元相关的平方作为对公因子方差的初始估计。 3 B/ d( Y* B. m0 @ ⑥Alpha α因子提取法 0 n: B/ i5 ^# C( e& m5 C+ k+ t% r% w4 A ⑦Image 映象因子提取法。是根据变量映象的概念提取公因子的方法。把一个变量看 " [: i, D( e: L# M2 H6 ]/ r ~9 a作其它各变量的多元回归。 * q( v1 E0 [5 c; O! N8 o(2) Extract 控制提取进程和提取结果的选择项 5 ^1 l8 W8 d& K3 E E5 R- N+ b 理论上因子数目与原始变量数目相等,但因子分析的目的是用少量因子代替多个原始变量,选择提取多少个因子由本组选择项决定。7 u0 w f( f$ U: R0 ~7 t
①Eigenvalues over 该选择项指定提取的因子的特征值。在此项后面的矩形框中给出系统默认值为1即要求提取那些特征值大于1的因子。指定特征值决定提取因子数目的方法是系统默认的方法。 # Z' D+ i# W, H ②Number of factors 该选择项指定提取公因子的数目。用鼠标单击选择此项后,将指定的数目键人到该选择项后面的矩形框中。/ D) ?! @0 Y- ^) D0 W) c6 K
(3)Display 指定与因子提取有关的输出项 / v& [: y: B* m2 x( t7 E3 |* B6 f& ]$ i& m ①Unrotated factor solution 要求显示未经旋转的因子提取结果,此项为系统默认的输出项。6 ?7 x# v& N" ?; o0 |+ |% @
②Screen plot 要求显示按特征值大小排列的因子序号与特征值为两个坐标轴的碎石图。, |- D% J1 @5 u
(4)Maximum iterations for Convergence, K3 Z: V1 z( V3 a/ A4 e
因子分析收敛的最大迭代次数,系统默认的最大迭代次数为25。; d; m6 m( m8 j3 U
Continue 按钮确认所有选择,返回主对话框;Cancel按钮作废本次所有选择,返回主对话框。 . s: N9 s; S: D7 m- L' f9 {3. Rotation 旋转方法选择子对话框* S* g I: ]' E8 l: ?1 `) ^
Rotation旋转方法选择子对话框选择项分三组。 3 t, N2 M- r# u* O. h: Q(1) Methed 旋转方法选择项- h. B% F2 O( d7 C S7 N) o4 q2 S I
①None不进行旋转。此为系统默认的选择项。 ; C% H H! N3 H) u H ②Varimax 方差最大旋转 M! |, R: {3 G. }; c" N \& j ③Equamax 平均正交旋转 % T) o5 z3 n% V8 H ④Quartmax 四次方最大正交旋转 $ v1 L7 f6 s6 H; G ⑤Direct Oblimin 斜交旋转,指定此项可以在下面的矩形框中键入Delta值,该值应该在0~1之间,是因子映象自相关的范围。0值产生最高相关因子,大负数产生旋转的结果与正交接近。$ B5 `; W0 a; b6 q( y. i
(2)Display 有关输出显示的选择项% F! m/ {, x4 @( Y5 w
①Rotated solution 旋转结果。指定此项将对正交旋转显示旋转后的因子矩阵模式、因子转换矩阵;对斜交旋转显示旋转后的因子矩阵模式、因子结构矩阵和因子间的相关阵。 ' w- g9 l" {- e( N6 C b/ Z ②Loding plot(s) 因子载荷散点图。指定此项将给出以两两因子为坐标轴的各变量的载荷散点图。如果有两个因子,给出各原始变量在Factorl-Factor2坐标系中的散点图,如果多于两个因子,则给出三维因子载荷散点图。 Z( z& ]5 k4 F7 d5 f. J0 T
(3) Maximum iterations for Convergence:旋转收敛的最大迭代次数。系统默认值为2。可以在此项后面的矩形框中键入指定值。 & l" y0 b+ c& @$ u4.Factor scores 有关因子得分的选择项 1 N9 ~- z# R. F N; c8 w" S 有关因子得分的选择项在Factor scores子对话框中。 1 H: Z* ^) e G; E$ m 选择项共分三组: % W: m0 w9 q" I(1) Save as variables 选择此项,将因子得分作为新变量保存在数据文件中。程序运行结束后,在数据窗中显示出新变量。对每一次分析产生一组新变量,用最后一个数字字符表示分析的顺序号。每次分析中产生多少个因子,就生成多少个新变量,因子序号占倒数第三个字符的位置。倒数第二个字符为“_”。在输出窗中给出对因子得分的命名解释。 * c4 A) L% c+ \2 |" @(2) Methed 指定计算因子得分的方法。可供选择的方法有:% f8 T& q7 l1 k* k- b
①Regression 回归法。其因子得分的均值为0。方差等于估计因子得分与实际因子得分之间的多元相关的平方。: p0 y8 P S* |$ l% C+ {6 E ~- J
②Bartlett巴特利特法。因子得分均值为0。 # r% B( J( \+ Q4 y% j" } ③Andeson-Rubin 安德森一鲁宾法。是为了保证因子的正交性而对巴特利特因子得分的调整。其因子得分的均值为0,标准差为1。 - x; @, Z$ v: `" x& N(3)Display factor score coefficient matrix 选择此项将在输出窗中显示因子得分系数矩阵。是标准化的得分系数,原始变量值进行标准化后,可以根据该矩阵给出的系数计算各观测量的因子得分。 ( I1 B4 i E) `3 m v5.Options 有关输出的选择项 ) s" l( g& D1 d. u! P+ L _ 有关输出方式以及对带有缺失值的观测量处理方法的选择项均在Options子对话框中。 8 M2 Q- o, ^5 K1 f8 N" U& C: o: E(1)Missing Values 缺失值处理方法选择项共有三个:9 h5 e5 x" }' q1 `9 g* E
①Exclude cases listwise 选择此项,在分析过程中对那些变量中有缺失值的观测量一律剔除。所有带有缺失值的观测量都不参与分析。 4 b( y1 e( X; q# y1 o6 [ ②Exclude cases pairwise 选择此项,成对剔除带有缺失值的观测量。换句话说,在计算两个变量的相关系数时,只把这两个变量中带肴缺失值的观测量剔除。如果一个观测量在正进行相关系数的变量中没有缺失值,其它变量中带有缺失值,那么不影响当前相关系数的计算。1 g, ^6 L% _4 D! B U- ^
③Replace wlth mean 选择此项,用该变量的均值代替工作变量的所有缺失值。 1 A; N" K9 N0 `' J) [(2)Coefficient DiDisplay Format这一组选择项决定相关系数的显示格式:/ e% a/ R- Y; V* s+ [0 u
①Sorted by size 选择此项,系数按其数值的大小排列。 6 s& t# V% P: U" N ②Suppress absolute values less than:选择此项,不显示那些绝对值小于指定值的相关系数,选择此项需要在该项右面的矩形框中键人临界值。系统默认的临界值为0.10。+ i/ I2 U V) {5 u1 Q [img=584,5]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img] i* C+ V8 D7 J) Y8 G 10.3 因子载荷的统计意义 " P$ J* ~4 |; A3 y- F 在因子模型中,假定原始数据已标准化,即原始变量的均值为0,方差为1。并且假定各公共因子和特殊因子都已标准化,即平均值为0,方差为1,在此基础上,我们可进一步讨论与因子载荷有关的一些量的统计意义。 # H, R6 m; K; S+ f9 } V& Z9 |1.因子载荷的统计意义! |+ D5 M2 P) j0 L 因子载荷矩阵:/ @, q7 K: `8 o5 N: n; |- l
[img=272,130]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img] ! o4 w4 c h8 R! ^因子载荷aij表示第i个变量和第j个公共因子的相关系数。- r5 v8 U/ e) R6 U1 ^1 A9 R
即 rxiFj=aij- x$ Q0 k5 J5 H) i( l
aij越大表示公因子Fj与变量的关系越密切,如(10.2.7)式中所表示的载荷矩阵,第一主因子F1与变量x1、x2、x3都较留切,而F1与x4的关系不够密切。 7 p' K" e1 f/ O1 H5 x2.变量共同度的统计定义 , V$ U4 l4 r/ ` 因子载荷矩阵中各行元素的平方和。+ O1 k* Y9 o! O, m" a
[img=256,126]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img]8 ~& F3 u3 ?; Y5 Q& q' Z 称为变量x1、x2、...xp的共同度。# Y0 P" h! v0 F) `4 ?
计算每一个变量xi的方差:. e w" f& O. ]' k+ K# D Dxi=ai12DF1+ai22DF2+...+aim2DFm+ai2Dεi ' L$ D( v1 c/ l9 O1 z9 Y由于假设原始变量xi和主因子、特殊因子也都进行标准化处理,所以有: 5 G7 I6 H* L, |/ H* d! e2 F 1=hi2+ai2 . W+ l* O. I: x# p即变量xi的方差由两部分组成,第一部分为共同度hi2,它是全部公因子对变量xi的总方差的贡献,如公因子的方差接近于1,则说明该变量的几乎全部原始信息都被所选取的因子说明了。如载荷矩阵中h1=0.97,即变量x1的97%的信息量被第一主因子和第二主因子说明。1 Z6 H" M5 w- C9 E' G" A* r 第二部分是特殊因子的方差,仅与变量xi本身的变化有关,它是变量xi的方差为1的补充值,当不考虑特殊因子时,公因子方差hi<1(i=1,2,...p)。 ( A% J6 F3 q8 B" O, N8 M9 | 公因子方差的意义在于说明当由原始变量空间转为因子空间后,保留原来各变量的信息有多少,当hi越接近于1时,说明空间转化性质越好。 3 w& \) x1 h# A* C3 t3.公因子Fj的方差贡献统计意义5 a$ S: D R `! T; [/ \
各列元素的平方和Sj为公因子Fj的方差贡献。 8 S' w' a, r+ N2 ?. A; i, Z x0 H [img=276,122]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img]/ V2 D9 M |3 f) b9 q7 R
Sj是公因子Fj对诸原始变量所提供方差贡献的总和。它是衡量公因子相对重要性的指标,它等于公因子Fj所对应的特征值,即 # X4 N- |2 L0 o4 U; \& k4 l [img=108,52]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img]" L2 e+ l0 N# l: H
[img=584,5]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img] / d' m* L- v3 V& V- s2 q/ N6 A10.4 方差最大正交旋转 2 ~. n+ S9 f- O 主因子分析的目的不仅是找出主因子,更重要的是知道每个主因子的意义。但是用上述方法所求出的主因子解,初始因子载荷矩阵并不满足“简单结构准则”,各因子的典型代表变量不很突出,因而容易使因子的意义含糊不清,不便于对因子进行解释。为此须对因子载荷矩阵施行旋转,使得因子载荷的平方按列向0和1两极转化,达到其结构简化的目的。' t. I3 ]. T1 { w
采用方差最大旋转(Varimax rotation),使因子载荷矩阵中,各因子载荷值的总方差达到最大作为因子载荷矩阵简化的准则。这里总方差最大,而不是某一因子方差极大。即是说,如果第i个变量在第j个公因子上的载荷经过“方差极大”旋转后其值增大或减小,意味着这变量在另一些因子上的载荷要缩小或增大。所以,“方差极大”旋转是使载荷按列向0、 1两极分化,同时也包含着按行向两极分化。 + j# Y, k, b! ?0 f/ a" Z b设因子载荷矩阵为:. [& ~4 ^$ D# R: N0 S" Q, B& ~, v
[img=276,123]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img] a" I% u, E% `4 q4 h
bij为经过方差极大正交旋转后所得到的因子载荷矩阵B的元素。 0 _" |1 y' l- x7 e8 P. g某一因子Fj的简化可由因子载荷平方的方差来表示。. V: T/ ~7 ~0 M0 E
[img=364,130]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img] ' @; B) l9 V# V( @3 T如果Vj为极大值,则此Fj因于具有简化性,它的载荷值或是趋于1或是趋于0。( w# ]4 Q7 Q% V* I5 F6 o 例10-1中的载荷矩阵进行方差极大旋转,经过二次正交旋转即收敛。, B5 I# C( ]& L( m; y4 r* N
第一次旋转的总方差值:V1=0.260395 , h3 T. y3 Q0 i9 G- E# O 第二次旋转的总方差值:V2=0.347423; F8 j6 K. }( {. _& H1 t7 {
旋转后的正交载荷矩阵为: $ ~4 y+ D/ `; [/ H [img=248,129]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img]0 v8 C2 |1 R$ _" S9 y1 v* B 旋转结果明显将因子载荷向1和0两极方向分化,这样便于给予明确的经济意义上的解释。" E, X' _4 |9 A/ v/ u [img=584,5]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img] 3 _; J7 |) E$ s9 |10.5 Promax斜旋转 1 b5 }0 Z3 A0 a. N! r, @ 在方差极大旋转过程中,因子轴互相正交,始终保持初始解中因子间不相关的特点,然而在社会学、经济学、心理学等科学领域内,斜交因子是普遍规律,即相互影响的各种因素不大可能是彼此无关的,各种事物变化的各种内在因素之间始终存在着错综复杂的联系,因此需要介绍斜交因子解,即将变量用相关因子进行线性描述,使得到的新因子模型最大程度地模拟自然模型。 4 M: t e, E( s- F! @0 g1.斜交因子模型和斜交因子解 - ^; ?+ \ s* L( u; H 如果p个相关变量x1、x2、...xp,用M个相关斜交公因子T1、T2、...Tm表示。 $ v/ d& L9 p# o: N# ~ 斜交因子模型为: 5 X' z# b4 Y' L7 X2 z [img=324,118]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img] ) H: W0 _0 k2 N T1为斜交公因子,bij为斜交因子载荷,它表示变量xi的向量pi在斜因子轴Tj上的坐标,在斜交因子轴情况下,坐标和投影,即模型和结构之间有差别.如图10-1所示,T2是斜因子轴,pi为因子空间中表示变量xi的向量(pi的长度|Opi|=1),pi在OT1T2上的坐标为OQ、OR,坐标值可正、可负,且绝对值可以大于1。而pi在OT1T2上的投影为OM、ON,坐标值也可正、可负,但绝对值不能大于1。而在正交因子空间中,坐标值和投影值一致,即因子模型和因子结构是一回事,无需区分这两者。所以一个完全斜交因子解必须包括因子模型和因子结构两大部分。0 d! c2 J$ I; T* ~# h
[img=264,226]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img] . r( K) P9 v& k0 l& [/ j 图10-1! q% _% E" R! t; _ 例1中两个正交因子(M=2)经过Promax斜旋转,得到斜交因子相关阵为: 3 E9 l; x: w6 Q4 i7 O9 T[img=240,55]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img]. @1 J) ?8 i$ @! D* o 斜交因子结构如表10.4所示: 5 r8 Z6 }9 a( c( T. P3 ? 表10.4 斜交因子结构0 R# R" T$ Q% Z5 ]1 w3 x1 R6 k' {
变量
第一斜交因子
第二斜交因子
煤气液化气户数
0.9999
-0.2610
卷烟销售量
0.9999
-0.2740
蚊香销售量
0.9999
-0.2511
火石销售量
-0.2709
0.9999
由表10.4知,斜旋转的结果与正文旋转结果基本一致,第一主因子仍主要由变量x1、x2、x3表征,第二主因子仍主要由变量x4所表征。0 t# s! ]+ G; R; w6 f
斜交因子模型如表10.5所示:9 |2 y+ p. v" y 表10.5 斜交因子模型+ o* h/ `2 Q& \1 Z' b4 |: H
变量
第一斜交因子
第二斜交因子
煤气液化气户数
1.00002
0.0011
卷烟销售量
0.9965
-0.0128
蚊香销售量
1.0030
0.0117
火石销售量
-0.0094
0.9974
0 h9 c/ ?, m5 `& h0 u1 g
因子模型矩阵是把变量表为斜因子的线性组合,所以例1的斜交因子模型为。! ^1 I3 m0 H, u% l: h
x1=1.0002T1+0.0011T2- `' B E* z8 Z) [) [, x6 r
x2=0.0095T1-0.0128T27 V3 H# u* M# d( k. @) _
x3=1.0030T1+0.0117T2# D6 G! E$ G% N7 [* S5 q5 O
x4=-0.0094T1+0.9974T2 2 {( p0 C; d4 O; d( r/ H6 U, K. V 由此说明:煤气、液化气户数主要由斜因子1提供,而打火石销售量主要由斜因子2提供。 9 e) _; s- r* h! d10.6 因子得分 ; U: K' N9 i/ {+ ?) N5 I 因子分析是将变量表为公共因子的线性组合。由于公因子能充分反映原始变量的相关关系,用公因子代表原始变量时,更有利于描述研究对象的特征,因而、反过来将公共因子表示为变量的线性组合(如同主成分分析一样),即用:8 p& a. u+ M" A# V( [4 k% \& ^6 l- D Fj=βj1x1+βj2x2+...βjpxp. o" W3 W* J- n (j=1,2,...,m) 1 a% ~0 }( m6 q/ f( R+ A0 H来计量各个样品的公因子得分。上式为因子得分函数。 " r& R t' H- B& t, I$ p) o( t4 U 由于上式中方程的个数少于变量个数,因此,只能在最小二乘意义下对因子得分进行估计。Thomson(1939年)假设因子可以对p个变量作回归,即建立回归方程: P* Z' E ^% z, _; w& G由于变量和主因子均已标准化,所以有:: x/ G; x- U4 t0 c1 g [img=332,68]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img] 8 @, M/ o( H3 d0 j8 j由最小二乘估计有:2 o% x3 a9 U+ m% L- B [img=148,34]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img]" X7 n6 A9 V- j7 @- G1 w( p1 K" @
这里 ) [! Z! ?$ ^6 i: ` [img=280,117]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img] " |- j3 b* h( y( F4 a% p% ?为原变量的相关系数矩阵。: u+ m! @ u) q W
A'=(aij)mxn ) F$ l0 N9 r# N3 b2 B% b3 N当因子正交时,A’为旋转后的因子载荷矩阵A的转置,当因子斜交时,A'为因子结构矩阵的转置。 6 ]/ p7 ^) d% a v) O [img=212,63]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img]% t' {1 _( T$ }8 q+ E
例1中数据的正交因子得分表如表10.6所示。 2 [( A) Z8 E: H D P) e& N表10.6 正交因子得分表7 T. ~& `$ ^% J
根据因子得分表,以F1和F2为因子轴做因子得分图、如图10-2所示。它将20个抽样样本分为三类、一类以F1得分是负值、F2得分是正值为特征;另一类是以F1得分是正值为主要特征;再一类是以F1和F2得分都是负值为特征。由因子得分图可提供一个样本分类的参考图形。# [1 T. v# U) b
[img=536,520]mhtml:file://\\192.168.41.240\2010数学建模资料汇总\光盘4\729-补充材料多元\多元讲义\5-因子分析\第十章 因子分析.mht![/img], ?2 o. J) R5 Q3 D9 G