在线时间 67 小时 最后登录 2021-7-19 注册时间 2017-9-1 听众数 12 收听数 1 能力 0 分 体力 2062 点 威望 0 点 阅读权限 200 积分 676 相册 0 日志 0 记录 0 帖子 110 主题 52 精华 0 分享 0 好友 13
TA的每日心情 奋斗 2021-6-27 15:42
签到天数: 27 天
[LV.4]偶尔看看III
版主
国际赛参赛者
TA的关系
群组 : 冬令营普通班
群组 : Latex研学群
群组 : 2018美赛护航培训课程
群组 : 2018美赛冲刺培训
群组 : 2017科技论文写作
这期主要讲例题来加深一下对主成分分析的认识。
, E) S/ P6 \( |0 J 例题一: 成绩的综合判定
5 D* b7 S6 E, ?" z 为了对学生的教育实习成绩进行考核和评价,考核指标有如下:1. 实习态度 2. 语言 3. 板书 4. 授课内容 5. 辅导 6. 实习总结 7. 活动组织能力 8. 个体思想工作
; J6 j, c9 O2 R& S; Z 而一共有 8 名学生
4 y! n8 E! `. Q% L 这样的话我们就可以得到一个 8*8 的邻接矩阵,然后我们就要开始主成分分析的步骤:/ g3 G7 U6 D9 D5 [3 i9 n
& {* O6 y9 ?7 @1 Z
先看一眼原始数据:3 j5 Q4 A4 w: T& e$ u" |& W8 t5 {) z
. J! S0 r4 X5 J+ o2 u) C step1:标准化数据(matlab 一句代码搞定 :zscore(X),便可以将邻接矩阵标准化 )
. q) m9 h; O6 u( O' k& q5 R4 r
$ q4 s3 U$ q& e# o( M Z. _3 h0 R step2:求特征值和特征向量,这一步可以用两个函数求:princomp 函数与 eig 函数 3 M& |: M L! A; I( C! U" J
+ C1 E4 x' {2 j" ^+ v
step3:求出特征根,85%原则下得到主成分:5 H% y+ \ I( o# i5 W
3 w9 L) |3 V0 ^5 ?' c; v
0 l( L( w$ _! E: k% D) _0 ~- H: V5 V4 g
将上面的特征值从大到小排列按85%原则会选出前三个特征值,然后得到新三个指标下八个学生的得分情况:
+ T7 I) r% \. |, ?" _: Y9 V
$ x& l& |1 e2 D: o ! x. P" U( Y* O
然后做出贡献率直方图:1 a# A$ V8 h7 ?% \
4 p; b4 i& E3 Y3 x& J. o
# a' @* f+ U z) b7 P* D* c
这下我们的过程基本就结束了。
0 k( o+ {( Y. u
7 Z, o% j# t6 A, Y+ Z 3 Z. t7 z9 @+ @; D H# E- b) \$ C
3 Q; k# k: _9 E- N# i
1 @) s) w$ G5 ?+ y0 F. L; ` 但是并不代表我们分类就这样结束了,必要的话我们还得分析一下我们分类过程损失的信息量重要不,或者说误差函数。通俗讲就是我们分几类合适,三类只是保证了85%,那四类、五类行不行?! e, \$ f, g9 c+ O5 b& A
这就需要进一步分析....附件中有详细过程,请下载观看。
, R( {1 ]( ~* J( @6 {
' ^4 g' Y; O2 j# } 5 C" ~+ c$ @! ~7 \
* D" m; L( t z) l6 q
( i2 H& E9 h+ M% A1 P2 M
看完记得回复,有体力的下载啊!!!!!!!!!/ Q1 i8 @) ]1 ^; u6 ?
" s9 C' t B9 q. K. l, {8 B 6 S2 c9 H/ M9 i4 S
zan