主成分分析的计算步骤
主成分分析的计算步骤设x = ( x1 , x2 , ⋯, xn) T 为n 维随机矢量,则PCA具体计算步骤如下:
(1) 将原始观察数据组成样本矩阵X ,每一列为一个观察样本x ,每一行代表一维数据。
(2) 计算样本的协方差矩阵:
(3) 计算协方差矩阵Cx 的特征值λi 及相应特征向量ui ,其中i = 1 ,2 , ⋯, n。
(4) 将特征值按由大到小顺序排列,并按照下式计算前m 个主元的累积贡献率,累积贡献率用于衡量新生成分量对原始数据的信息保
存程度,通常要求其大于85%即可。
(5) 取前m 个较大特征值对应的特征向量构成变换矩阵TT:TT= ( u1 , u2 , ⋯, um ) m < n
(6) 通过Y= TX 计算前m 个主成分,达到降低维数的目的。
详细内容见附件:
页:
[1]