森之张卫东 发表于 2015-7-29 15:40

主成分分析的计算步骤

主成分分析的计算步骤

设x = ( x1 , x2 , ⋯, xn) T 为n 维随机矢量,则PCA具体计算步骤如下:

(1) 将原始观察数据组成样本矩阵X ,每一列为一个观察样本x ,每一行代表一维数据。

(2) 计算样本的协方差矩阵:

(3) 计算协方差矩阵Cx 的特征值λi 及相应特征向量ui ,其中i = 1 ,2 , ⋯, n。

(4) 将特征值按由大到小顺序排列,并按照下式计算前m 个主元的累积贡献率,累积贡献率用于衡量新生成分量对原始数据的信息保

存程度,通常要求其大于85%即可。

(5) 取前m 个较大特征值对应的特征向量构成变换矩阵TT:TT= ( u1 , u2 , ⋯, um )  m < n

(6) 通过Y= TX 计算前m 个主成分,达到降低维数的目的。

详细内容见附件:
页: [1]
查看完整版本: 主成分分析的计算步骤