- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563414 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174247
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
使用统计假设检验验证! D" K& {; ?1 z! n3 [7 n7 `
文章目录
5 h! Q. f: m& c& B* G7 ?/ V. R1 o: t- C8 t# d' p1 i
常规检验% U' p: v; Y5 G% }- J8 q
二项检验
1 m- v) {: `8 [1 B2 J% k' ?& t& Lt检验
& f" S/ e+ U9 M一个数据集比较两个算法的检验" m A3 Z( `: p- r% g
交叉t检验( U. C0 E8 b6 K r6 m, Q
McNemar检验9 `+ f" l/ r C
一个数据集比较多个算法的检验6 h$ m$ R0 Z6 q* B$ j3 d4 a
Friedman检验
7 R4 \: x: G4 g' ^% U3 V# U# f9 p& yFriedman检验图" I3 a3 _) [+ m( T U9 w ?/ j9 v
F检验常用临界值
$ |# p8 }* d/ \3 M2 m- [, f. I& xNemenyi检验常用值9 b" S' y& S% r5 l
闲得慌# B C6 l9 n, s; M- U9 K
统计学是以小样本来估计总体。; L. S8 d' C! b! g; o. G) H
6 v6 o7 A7 g" F+ @# u8 @
在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。" @# S2 ]% K" I# @
+ o2 C0 a! b2 i常规检验# l' l, X' Q# |2 A- n* D# K
9 S9 B1 `% b; S- _7 Z5 [二项检验
# y- c. i" Y7 |4 B. n: a/ w7 q W7 W
假设检验步骤及二项分布的介绍: |+ N# _7 g/ o2 C0 A
" m" _. o( @; l9 W7 _1 U
& Z* D+ O2 X& R4 _/ a' ]
+ C1 ] v$ T0 s* o9 l+ Vt检验- F+ p% }; f2 e3 H" h' X m/ r
4 h4 s) Q. }, b* @. l7 t多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。0 F% t6 E0 A! v# s
t检验可分为单总体检验和双总体检验,以及配对样本检验。
6 R1 h, b( Q; i' P; b9 W y: z三种T检验的详细区分。
9 S: G% V; G; f5 ?- Z; O4 E) ot-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
/ w3 d* Z, }2 N' S
" x9 r/ P3 u$ D" o+ T- ^) `8 _一个数据集比较两个算法的检验1 O$ H' V. H" U; i- z
, T& D! y, V/ v g+ l4 F
交叉t检验
4 }9 N; y. r1 k! H( p# P- l5 R1 }! A' c) _
交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。
' W0 B* X% ^1 l基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。
0 y$ R+ @4 d! l) D5 K假设:学习器性能相同。
& M7 }- X7 ?" K! c
{4 O1 Q4 e R0 A
q7 n) w% P% @
% L) n+ R. h8 ^) G; f1 YMcNemar检验
% L: j0 H( d( P N" d3 D, N) u" G) z0 X0 A* i& V* b5 J5 [5 o
卡方分布的解释。
: O9 F" p+ ?+ O+ E2 I) a: H. a, x1 R2 d& TMcNema检验是一种列联表的同质性检验。
3 D% I3 t- H) |! m5 k0 P: S" B& D- C- `/ l8 Z/ n( ]5 m3 R
# G. r& N+ [% K/ e( }; p2 o% C* d9 x; \' c3 \ j/ [! u
一个数据集比较多个算法的检验
6 ^# d. s) u6 G- p: J# b
- o; @: l- \% e+ I' o两种思路:5 I6 X* z' u! e. ?
& A: w# t5 c1 ^
算法使用上述方法进行两两比较,直至产生结果。
8 o7 E( S K8 F6 \& H# b+ k9 ]对算法结果进行排序,如Friedman检验。
1 @. {( l. g7 H: iFriedman检验
+ }/ U% H! G5 X+ x4 J9 h8 N' Y8 ]+ F/ F. ?9 a% X
先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。
{, I) z! w" \
1 D" r' d* q+ {
' W0 @( X' G7 v: k& z) J5 \: t0 r4 s+ q% J2 g# }
Friedman检验图
/ j V0 d1 B1 d8 Q- a$ m
6 v6 ]# W7 D' m! L* V
F检验常用临界值
# u& a7 N% G, u, `
8 @' |7 B. Y2 ?
Nemenyi检验常用值
W) D6 E% f, I: ^ k
2 o. }" {7 Y: j8 H+ x5 X7 x* z3 \" f0 }" J# l
————————————————
6 s3 T5 P8 Q/ f& W8 g版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。8 W0 H! S1 O# a7 x6 d
原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
% C( z- `1 q$ W( s( u
' q2 z9 L: Y2 J/ e
( z6 q1 e* j1 ?- H: e& q1 s/ `# G* y |
zan
|