对转轴效果的验证 如果转轴效果好,变量则聚集在两轴的末端,表示变量在某一主成分上具有较大的因素装载量:如果变量落在原点附近,则表示该变量对应两个主成分的装载量都很小;如果变量不很靠近两轴,则表示该变量同时被两个主成分解释,这时不理想。 基于主成分分析法与人工神经网络的选矿建模 我们以云南某铜选车间1980年一19%年的月报表部分生产数据为例进行研究。对数据的主成分分析和相关分析,可利用目前最流行的统计分析软件SPSS来完成。 相关性分析 利用SPSS软件包中的相关性分析功能对原始变量中输入因素:原矿品位、氧化率、黄药用量、#2油用量;输出因素:精矿品位和回收率:对输入输出因素之间进行相关性分析。相关系数采用ePasron,即皮尔逊相关。显著性检验采用Two一iaTled,即双尾T检验。分析结果见表3.1,.32及3.3,表中带“**”的数据表示在.001显著水平,带“*”的数据表示在.005显著性水平,其对应的两指标相关,否则不相关。 数据预处理 由于选矿数据量纲和数量级的不同,使得数据之间的差异性比较大,因此,在进行主成分分析之前要对数据进行标准化。因为神经网络BP模型要求数据在某一区间范围内,本文采用线性插值法对数据进行预处理,处理后的数据. 主成分分析 主成分分析法的实现可以通过数学计算来完成,也可以借助于计算机来实现。本文采用SPSS中的主成分分析功能对表2.2中的数据进行分析。其参数选取为:主成分提取的特征值为大于卜未经旋转的主成分提取结果、要求提取主成分碎石图、Varimax旋转法、主成分分析矩阵、主成分相关系数矩阵等。各主成分的特征值;r:各主成分特征值占特征值总和的百分比自上至下各主成分方差占总方差百分比的累积百分比。主成分分析碎石图可以看出主成分1与主成分2,以及主成分2与主成分3之间的特征值之差值比较大。而主成分3、4之间特征值差值比较小,可以初步得出提取两个因子将能概括绝大部分信息。主成分初始提取结果可以看出按照提取特征值大于1的原则。那么应该取前两个主成分。而前两个主成分已经对大多数数据给出了充分的概括,两个主成分可以解释总方差的71.723%是主成分负荷矩阵.表3.6旋转后的主成分负荷矩阵。可以看出第一个主成分对原矿铜品位、黄药用量、2“油用量有绝对值较大的负荷系数;第二个主成分Z负荷系数绝对值较大的正好是四个原始变量中的另外一个即氧化率。旋转的目标就是使主成分负荷矩阵更简洁。通过这个系数矩阵可以用各原始变量写出主成分表达式(删除绝对值<.05的系数):
3 m7 A2 C$ ?. R$ ^! q3 @
3 o3 c$ M* b, f1 F. a" m |