在线时间 67 小时 最后登录 2021-7-19 注册时间 2017-9-1 听众数 12 收听数 1 能力 0 分 体力 2062 点 威望 0 点 阅读权限 200 积分 676 相册 0 日志 0 记录 0 帖子 110 主题 52 精华 0 分享 0 好友 13
TA的每日心情 奋斗 2021-6-27 15:42
签到天数: 27 天
[LV.4]偶尔看看III
版主
国际赛参赛者
TA的关系
群组 : 冬令营普通班
群组 : Latex研学群
群组 : 2018美赛护航培训课程
群组 : 2018美赛冲刺培训
群组 : 2017科技论文写作
这期主要讲例题来加深一下对主成分分析的认识。 D' l! e# I: T1 W
例题一: 成绩的综合判定 ' k' N$ E% w. N5 {; a! D
为了对学生的教育实习成绩进行考核和评价,考核指标有如下:1. 实习态度 2. 语言 3. 板书 4. 授课内容 5. 辅导 6. 实习总结 7. 活动组织能力 8. 个体思想工作
( z) Z5 E! I; }9 \ 而一共有 8 名学生
$ Z" _3 }& d& S 这样的话我们就可以得到一个 8*8 的邻接矩阵,然后我们就要开始主成分分析的步骤:; E( Z8 f4 N' K) A
$ b. B# B$ `% i, T1 y! D# F2 H
先看一眼原始数据:
! f2 o% C& D- Z _
( ^9 z2 }7 K1 T step1:标准化数据(matlab 一句代码搞定 :zscore(X),便可以将邻接矩阵标准化 )4 \9 ?/ W- i9 q; u, m
' c, B. L2 a# H9 E$ M5 i
step2:求特征值和特征向量,这一步可以用两个函数求:princomp 函数与 eig 函数 " O. R2 k/ Z; M" @$ S+ z* Z
" P; @& Z: x D: j/ S
step3:求出特征根,85%原则下得到主成分:
8 R+ c' ~" m; G$ D l
2 ?9 e. [( Q/ q7 o4 Y8 a( o ( h, p4 L2 P8 ]* l" @
将上面的特征值从大到小排列按85%原则会选出前三个特征值,然后得到新三个指标下八个学生的得分情况:- O% ~& F6 O9 u) Q* a3 G
9 C H2 S3 a7 W* G/ E( { |* G " }8 V4 a/ m* n
然后做出贡献率直方图:
# s9 B) N. p( w6 V( @
; e, Z. l- B. p5 s6 P0 W8 ?0 t
0 k/ M$ e2 C1 V% V4 D& s+ b 这下我们的过程基本就结束了。7 _! Q$ F5 Z+ i: d8 S7 |. p5 l; H
1 A1 a. a" f" Z- x0 O
' d: x0 s6 F7 H - N0 S2 i1 n& W+ f" q3 C1 W
) b5 C Z6 s1 b; C. ~
但是并不代表我们分类就这样结束了,必要的话我们还得分析一下我们分类过程损失的信息量重要不,或者说误差函数。通俗讲就是我们分几类合适,三类只是保证了85%,那四类、五类行不行?/ D/ `3 ^1 W: U* {+ `8 \: u1 @
这就需要进一步分析....附件中有详细过程,请下载观看。
) Q% W8 t1 W) s" X& G: ~6 B 2 }& A+ a- }' F
t( @2 e- j, t) r* Q0 z5 [: Y; u. k
6 a9 H# i% u0 H Q8 z. r' @ ; o2 i% Z( y$ x
看完记得回复,有体力的下载啊!!!!!!!!!
) ^* h! J9 }3 e* `) J; f8 H
! b! Z& r, t9 V9 I' a1 e2 w4 A7 e( s : Z t% o7 c+ N+ ?; @( q
zan