- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563404 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174244
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
使用统计假设检验验证
2 q$ R8 Z+ h/ w2 J# j文章目录7 h( u: _+ o H, b5 z8 d
3 T. ^0 }* Y+ d常规检验
3 \8 r1 |' @8 Z+ b- @( L# ^2 U* i二项检验4 e) p; e/ C# {4 y/ W7 _
t检验
8 a( i r, q+ T9 e4 I' I一个数据集比较两个算法的检验
+ i) a9 `7 \1 q) S8 J) O! j交叉t检验
* s# m U" I$ y% \3 `McNemar检验
. j9 l$ g" `. c) ~, Y% f/ F- g; H一个数据集比较多个算法的检验
$ J. H! m; X" `( D# z8 U, dFriedman检验
5 J1 ]% N/ n1 b/ |& H \8 M/ WFriedman检验图3 R$ m: O, T5 K. A) K8 f6 a4 [8 h
F检验常用临界值 P5 ~/ Q8 m+ v+ _4 }4 O- S6 y
Nemenyi检验常用值
5 P1 J# N- L) v+ h闲得慌
: C t, P J- O; Q6 P统计学是以小样本来估计总体。
}$ ^# I2 T/ Z3 L8 B3 W+ R' f# F/ J0 ]2 n. r
在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。8 p3 I, b* z9 f0 \
) h% f# {2 y- k
常规检验
4 s6 g2 }! Y6 V/ {2 k" {# ?% [# [7 e
二项检验
* m/ u& n9 o( d! @
. K: S M' A; K d; K* p假设检验步骤及二项分布的介绍
5 k8 H2 k1 c: W& ?
. O5 C7 g" I3 @2 u
7 B4 P" x5 q' S+ T) T3 H& H$ O& B- e; P3 Y) }; R6 y, L0 k
t检验
9 h/ ?9 S2 z$ h6 l
. o5 J% Z' t7 T+ _7 @多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。
4 m9 {- L% x0 X8 m2 ot检验可分为单总体检验和双总体检验,以及配对样本检验。
2 G/ R4 [/ N0 v1 s三种T检验的详细区分。
; j5 I+ d, Q5 dt-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
; B$ P0 ~2 S8 m0 w) p9 M' R$ W
; [) `% J+ ~* e3 U一个数据集比较两个算法的检验
/ D. ]1 |# M* g& M# h4 l0 x/ j6 U$ y( p3 f$ ^* J- t
交叉t检验- C* |( R( H0 q: g
8 O1 F, B- z: N5 i交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。+ ^+ V4 F1 B' Q. o
基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。1 v, \& h8 f4 O+ J5 P7 Q
假设:学习器性能相同。, r, _/ c9 ?- c: ], j' D
0 ?7 G8 z& `" p4 _+ B
/ n! z2 {% x3 E% M! }
1 `/ }3 a* k+ [$ u9 `1 E
McNemar检验
9 ?) f7 W* W' U9 z$ u* `2 ~
& K' l) N5 \; I0 N5 \: r5 k卡方分布的解释。! Z) |" t2 L' ]$ _
McNema检验是一种列联表的同质性检验。( t; _1 m3 Y# y
! v' e4 w1 X0 M8 @
5 G* `' k7 @+ x! d& g0 q( j* ]9 q) D! g: n- D8 r F* x
一个数据集比较多个算法的检验, Y5 ?3 c G0 `' }2 ?
; P4 ]4 {0 Y1 T' e; q( H: D; _5 ^: Y
两种思路:
3 z& b- E7 L4 p2 q; k+ O3 N A" }1 A( ?( S
算法使用上述方法进行两两比较,直至产生结果。- }0 ~' O/ W' [) P4 m
对算法结果进行排序,如Friedman检验。1 B2 M" x8 e) ]- |8 Y. u, N0 B
Friedman检验
. d) G! L4 m1 s6 W
* S1 ]5 f3 z6 y* ?1 l, a: z. U先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。* A9 m$ P, E/ p' x! j9 r" H( \
. L5 g b c0 p# I q. @* w
. V$ T* h1 z6 F' o
5 {0 D0 l! D7 j0 R4 xFriedman检验图
( w( B1 K4 B! ~: j5 {3 W$ n
$ q' |2 F: ^, |5 Z& y5 ?; EF检验常用临界值 {6 m# F6 Y; w( V! {: j& x
( N7 q' {0 Y; e- Q& ~9 N! w
Nemenyi检验常用值
: _8 ?+ T. P& t) f6 A
+ P( c) |. P' M
1 U2 H, O& ]. L5 o————————————————
) ~, m; B1 d6 K# {3 {版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
$ ~* B( X4 j: l原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
( L% @; U7 o+ Y0 R6 ~) ~
6 Q3 Z4 o+ D- K9 i i) D7 q7 s) k5 \/ X$ S
|
zan
|