- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 558951 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 173058
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
使用统计假设检验验证% v2 b: Q E, [2 v1 x
文章目录
" B. Y; c% y2 b! j8 K+ h! g* n% j; U @1 e' p4 u
常规检验4 Y" X8 w! e0 l" f7 s
二项检验
' s" d N; f4 }; ?7 Pt检验7 x6 r7 d/ }7 w0 ^. O; L- d/ X
一个数据集比较两个算法的检验
+ W$ j7 b# z" E C2 N5 v% F+ @交叉t检验
+ t+ A# k I/ q! V! R2 UMcNemar检验
( C9 U& F# D4 p% L一个数据集比较多个算法的检验' X8 Y, p( u9 B5 q3 Q, h* ?
Friedman检验/ i4 i m; x5 R0 t" T
Friedman检验图
2 n1 h0 \# d3 O" e1 YF检验常用临界值$ A/ g3 L9 W% @$ x% o+ V
Nemenyi检验常用值
' ?- Q. F9 O1 k# T- [( s0 r闲得慌/ S$ O' i/ K, W* C# I
统计学是以小样本来估计总体。7 h, J3 O% s# A! e4 C ~% L
3 D2 e) B3 O% M/ G2 M7 V) R
在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。
1 s5 t6 {' Z/ B6 \) G$ F
( f9 b5 _ E2 k% r* {常规检验
' t' C' z- j8 s) V# x- c. E8 ]& |2 [: I# i+ o% t# ?5 B: K
二项检验$ {3 r* y% y% S
8 U* E9 M, m$ S/ @3 l( \ Q7 k( C
假设检验步骤及二项分布的介绍0 I, \8 _$ j( ^) R$ Z
! c, x) O8 z b+ j5 o3 ^" z8 G, Y7 U" t' y7 K
3 M( N9 j) n Tt检验1 c: t+ i, z6 \9 ^
6 C i# S( X- P多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。
5 Y! J( z* |& B0 Q/ d$ ^+ dt检验可分为单总体检验和双总体检验,以及配对样本检验。) @% t& \/ C# K: T* p; b
三种T检验的详细区分。( H3 C0 v$ P8 Y- z5 c( a, G
t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。& p+ [5 k. ]+ R: H3 i; q/ D
1 q; Q. q6 }# ?( z+ g8 ]
一个数据集比较两个算法的检验
: w* M7 F% B( B7 e: ?# j1 O
) j r- I o8 H5 T' r" Z交叉t检验
! K0 V& |& q3 c; C! ]4 ]" h* W+ @9 O
交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。; R; |; l3 W5 J6 o- {/ _( I0 E
基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。3 w; r" n; n K1 z9 A& D) h6 s
假设:学习器性能相同。
5 x# X: H* z7 G; q: N8 y
0 x- X B+ ^- l& G/ b2 ?
; T. }* \% ~, Q
4 Z- d: M0 q. H6 Q1 y
McNemar检验# c% X& w1 A% d u/ S
8 B* O* G* y& I# ]% Q4 }
卡方分布的解释。
* }% m ^; u. x6 gMcNema检验是一种列联表的同质性检验。/ ^5 h# D# U; t5 f
p/ s1 ]! C% X
4 A* \) g% K9 p& z
4 ^0 a. w6 I* e一个数据集比较多个算法的检验/ X: X& c7 `! f9 {% [7 o8 M' p
2 L, Z4 V& J, Q( P: t
两种思路:
4 Q5 U1 G! g! I. Q- W. y; Z
& _# c) ^5 k$ x' E) q& @算法使用上述方法进行两两比较,直至产生结果。
. `* k. g1 t7 w# X2 `+ s对算法结果进行排序,如Friedman检验。
9 m- f5 q& O/ N) O2 N% eFriedman检验 ]9 R4 Y% l1 }4 M$ H
$ C% _" Q' u$ s# y' Y" N* ^6 V先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。" o/ m4 S8 I7 R" F, I4 d
4 A, \& d1 c+ S7 X
0 D" r6 p, u" u% \+ M
1 X& s3 R$ Y* w" T* X- }, p
Friedman检验图
- f4 Q4 U! n! p4 _* N, ]8 i
: P/ O& r! O: }- N6 m3 zF检验常用临界值+ K3 P) r; H1 h$ y0 t/ o/ }) a
. n5 f$ F. h& [: z& O/ |
Nemenyi检验常用值
5 q. P- F- h0 v$ y, X
; l6 ?/ J, E, d& ]" o
3 _, I0 R: ~; Y2 H- a7 o————————————————
7 z9 `2 c/ \$ E5 c版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
4 Q2 D/ h+ L! p原文链接:https://blog.csdn.net/qq_35182128/article/details/1058863333 N6 s" O+ e1 ]& c
9 h- g& q) `! |( a" X6 K; k- u0 m) ^" p, G( h' z4 e9 w# a
|
zan
|