- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563372 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174234
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
使用统计假设检验验证) I5 c( c- R* W) x; A5 F
文章目录- f+ b* [! j/ A; H
8 X8 k6 c6 G) N常规检验0 H& W! d: S7 Q+ d; E+ v! ?
二项检验
+ l X; q) M7 l9 tt检验
5 a! U: W9 y2 I& o3 P; E一个数据集比较两个算法的检验
7 {; O5 J* T" C$ z7 i交叉t检验; i$ c% b* T7 C0 f" r
McNemar检验
Q" Q6 k! h8 q, c$ B- c7 T5 B一个数据集比较多个算法的检验3 G7 h0 H# r% q/ ?2 c9 C
Friedman检验1 c( c$ Y! Z) u1 _
Friedman检验图( }/ B, B) ] _* U% q
F检验常用临界值
; T8 O. O& u# V5 T% a/ INemenyi检验常用值
' o+ Z7 U' K8 Y# \/ ^4 u闲得慌+ Q; r# J4 I$ V( K
统计学是以小样本来估计总体。3 g; Y4 C8 @- z% b
; H0 h/ P! ]( o$ `4 l+ |
在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。; S j$ D& F4 \- X3 ]
8 n4 @1 j {' t( M
常规检验1 ]" F& z' o; x( D& {1 o
$ v$ S3 }5 Z% O w, _6 h# y0 ]
二项检验( C# Q/ D6 Y8 {; x
0 @3 U1 e {' t, C; A3 K' x8 W/ ^
假设检验步骤及二项分布的介绍
" j+ {7 x" K" }+ z7 n
* @ L' b+ j, D
t/ l' r8 u( p; e' j( L- y" M6 H, @6 t, k: V
t检验
- ~( w3 x& y2 Y$ d$ \5 u) k& G) G8 r+ l# u9 h$ s2 U+ ?& c
多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。5 c* A( K$ \3 _! k
t检验可分为单总体检验和双总体检验,以及配对样本检验。. k% h- L; Y. D- ~! \
三种T检验的详细区分。& b5 |; p: D1 O) j7 p
t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。8 k7 Y) O! j2 }& w( N5 T9 y) }
8 Y# Y6 K( H: Y6 O0 T一个数据集比较两个算法的检验5 D! X- {8 ~5 k6 f+ Y
, [, f6 c' @; U, j4 P9 x交叉t检验/ H1 k" d& f8 s+ A
5 U& p2 a* g5 l' l3 d2 E: R
交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。. u p% U) }5 q1 O) b0 Z) \" A$ ^* J1 G0 F
基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。* j% a2 e5 I! Q! P9 h/ y2 F( _
假设:学习器性能相同。! g+ F. Z6 T5 _* q
: ]9 D3 r Y2 K1 g+ ~
5 w% L, ^5 P9 ~: D) ]. Q( Z- v
5 I5 P3 w, `, e
McNemar检验
: r3 r. r! N6 m$ ]1 @2 a# y1 O3 `' r8 A
卡方分布的解释。
2 _, c& x& f9 p9 e& WMcNema检验是一种列联表的同质性检验。
& W$ f6 {. v* v( l' Y+ Y$ c3 G5 ~/ ]* J2 x& A0 D* n& A
8 u( s. U4 c9 T% v4 X. i7 L( N# u: e2 p/ [# c! i9 i5 ~$ O# s
一个数据集比较多个算法的检验& q. Z4 v' r% z8 I- c `
5 c5 V/ E7 H$ b7 V7 B/ o! r两种思路:
* m1 g3 `' Y V* U: q3 L) z) c* q' L4 x" R+ z5 R) ^
算法使用上述方法进行两两比较,直至产生结果。
! V+ b$ ]! l, G( }9 R* m对算法结果进行排序,如Friedman检验。" C" W- F9 Q1 d# `0 r) [* ?
Friedman检验1 H# @- k- ~# i8 N) V
$ l4 s) F6 r9 u* h( U+ O
先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。' v) G# r2 I/ L8 I% l
; @1 [9 t3 e3 T d2 |# G
) }4 z" e E, f9 j6 u. b
) E5 R7 q' E7 C& @: ~% K/ t$ N8 Q" X
Friedman检验图
" v0 B' j8 N$ \+ w4 `7 w( n" z0 T/ u. m8 ]- Z; a+ F
F检验常用临界值6 t* [+ k: C' Z* O
! l3 K- C j% s" R( w! I9 GNemenyi检验常用值
2 o5 n* s8 f7 b" f( c! J5 w/ d) r: O- j. X( I& o: N! w
6 g3 |, H2 \& b4 Z
————————————————
2 `0 O$ u4 C3 K; f版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
6 p9 [0 C8 ?2 b( c原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333+ W; K0 a6 J0 _0 i9 J! \$ R
0 V! O g( b" P/ t
" N7 ~, I( _) l# d6 Z: i |
zan
|