- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 556462 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 172311
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
使用统计假设检验验证* i, J$ d# G4 b& M8 ?
文章目录
1 g( _# L4 a J5 V3 l- v: ]/ h( ^; X" E0 C( g! g7 @) ^( i
常规检验7 C2 E9 K2 k0 z2 }+ Z* t
二项检验
" w' `; d3 ]% T8 E7 r9 W! p' ut检验/ o; H Z- u. g t- v' o( Y1 S
一个数据集比较两个算法的检验& Q. X. J" D2 Z8 z6 X
交叉t检验8 L" A& s" }5 o( c3 {
McNemar检验( s2 D6 p4 Q- e" B$ j( ^4 b: g
一个数据集比较多个算法的检验" h- o7 b* J0 ~; i
Friedman检验
# _. b; ^' d3 m5 R& T; c' a8 yFriedman检验图
* ?) O1 ?0 z8 m! o' p# eF检验常用临界值( W) @3 H8 e. M/ J8 Z" P
Nemenyi检验常用值
* h7 k' ?( Z% B9 u: {闲得慌
$ O; ^+ p4 V1 X7 B统计学是以小样本来估计总体。
5 n/ F5 h5 B- U# h. ^& w% l! }
4 s$ ^% [# U+ ]6 z在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。, L, V" p+ ?% B7 v
$ S2 o9 p) L% z# R0 w8 Q% c/ g常规检验
1 E* p8 s% k$ h4 b% n( f, U6 H
! {* ?5 ~# S* X. \% i二项检验
% K* ~/ t) {2 J0 z5 S" ~% N
' \. _8 j0 m% K; p0 o5 m假设检验步骤及二项分布的介绍3 Y3 x" ^9 k3 [# ^4 w
7 t1 j" J6 u$ w4 f8 {" S- l
' r! d- j, R3 q" m0 |2 j5 c2 G. K9 V' |% C8 }. n0 T: q
t检验0 C+ N8 n' h s9 J {
( K+ A$ e# d9 X, t
多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。# X6 }4 I4 l& j+ p; P
t检验可分为单总体检验和双总体检验,以及配对样本检验。
5 H3 ]( ^) P: i# p三种T检验的详细区分。
3 K9 S! Y7 { m% a; ?/ l' ct-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
2 c; _7 z+ q4 R4 r. `5 ^) E4 ]7 {* f5 A
一个数据集比较两个算法的检验
6 _' T5 a7 C4 Y& A; W# S
: X$ U+ }4 T2 K r& n. u交叉t检验" k5 Q5 Y$ a2 u, r- E& }
9 k& q; X; m+ y# I交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。
4 E3 G% f4 b+ a$ U5 n' _基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。 M6 }: r7 X) U( @4 O
假设:学习器性能相同。
c0 l4 w* {: R2 l* R$ h
; a# M8 Y) C+ Q/ o: l
5 A9 f8 [1 J4 ^# y& W. f0 h9 X6 e4 B/ g1 S* E
McNemar检验
0 e9 k: A. p5 t" g7 D2 R; K& [4 e% _9 N) B
卡方分布的解释。- Z2 m* Z. S; E% E- Z9 N
McNema检验是一种列联表的同质性检验。
* C1 G0 M* ?9 d; F6 V
" R7 Q% S/ z* R C( P
" a$ V+ g0 Q- V; j8 C8 f5 [, O4 r% D d6 t
一个数据集比较多个算法的检验
, }$ _! K, T: L+ V/ O& c
* i; E2 S' H& s% N' W* S m5 m两种思路:! H* b6 p6 z2 k$ S0 A m
" G/ Y8 m4 `) e1 I* W" M0 Q算法使用上述方法进行两两比较,直至产生结果。
6 l! G% F+ Y* I9 j0 Y2 C r3 X对算法结果进行排序,如Friedman检验。7 \4 j1 {0 {" A1 Y; a# N0 A
Friedman检验/ ~2 I& f; D! [% F/ b7 w
% }$ w* a+ I' ~2 x1 ]: N- H+ ]先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。
& `9 P' E1 N" R c1 \$ J" _8 ?$ P0 J
7 r3 W. I; }) j+ @ U1 U
% l2 q1 r& f) o+ F A3 rFriedman检验图
0 N) x; n( T8 {. b* n: L
+ o0 ^$ ]$ M" @9 ~4 lF检验常用临界值6 M. e8 U% ^. u7 ^
# i0 q. Q: W8 CNemenyi检验常用值
* o0 {& J2 D v; C6 g' h: e' h, P2 \% c8 K7 k2 \
9 i: S1 l! U' ^$ F" Q
————————————————1 t. K9 ?6 A8 i* k4 O
版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。7 k. J+ J5 M7 b D
原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333) P0 h8 C/ J5 y) l: E
6 s9 |/ O, k8 k
8 f% m; C) r6 d9 R) i |
zan
|