- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564561 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174591
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
使用统计假设检验验证
3 S! W& A* y1 D# o文章目录, A3 Y4 t! j' e9 ]+ ]- c
, E! N+ C* H J" G
常规检验( P, k' ^; |$ P$ ^4 |
二项检验- Q8 p4 X* `+ o6 z1 C. y! U8 K
t检验; e; w9 G$ P6 q' u3 ?+ U
一个数据集比较两个算法的检验' b, P3 s- j+ Q d8 J
交叉t检验
. s, x& N# c- v+ u) E! FMcNemar检验
1 U$ v( g% S" I6 o g一个数据集比较多个算法的检验 p% T, G4 w9 v% \2 H$ P
Friedman检验
3 i3 I5 E) U+ o# p. z( u0 ^Friedman检验图% @/ V$ ~; G6 a5 J2 ?
F检验常用临界值
9 @6 d: J, g- |7 qNemenyi检验常用值
; j: I7 \4 v5 K: q闲得慌
! B. x. c: H; `( e6 d- D统计学是以小样本来估计总体。& r0 u5 M& ?$ c) I1 N0 _& p4 X
9 C9 @4 Z. F6 ~# R9 i5 m9 t! j
在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。
2 w4 m, w5 {. j# r5 L! L7 s# T& v9 r: k5 d. \
常规检验
$ X* y ]( d/ d! }% x
& f2 L( z% U! z1 ^# B二项检验
! ^6 o8 B5 d. M7 Y" N" H( Y/ E. K3 s/ S. G
假设检验步骤及二项分布的介绍
" g8 T2 x1 g7 p* o+ c; z% L
0 d* Q7 n: q" [4 N* v
- ]/ z$ C. Y; f1 l ?9 O
, ?- M* {( g# S! s p$ Q8 lt检验
& M0 T6 b) Q$ f+ A& n( H. @- R* B9 G' _
多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。$ Y6 E0 R- X9 m" M% L
t检验可分为单总体检验和双总体检验,以及配对样本检验。
3 H, N2 Q5 M7 @+ V* F三种T检验的详细区分。
2 V7 v6 b2 ?) y, v9 W. n, k# d- jt-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。6 X/ n8 k& j% y; G5 k1 l
0 h( J) |0 h! [* `8 P一个数据集比较两个算法的检验
) Q, v7 v3 p7 g K8 i. e( `7 l( F* ~' W" r/ ^1 n
交叉t检验
; K3 H. g; ^- R9 q$ x q: o+ s7 [$ E, R1 C
交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。0 b: k7 s' S# J0 @0 O8 b8 H' A
基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。8 Z" y: ~; Q' q" A3 L$ ?% k; R
假设:学习器性能相同。
$ M2 c. J. H) C; Y1 m6 x
+ U) a' G c/ z0 s0 G
1 O* `. L1 C$ L% S$ a) K+ Z
8 u5 Q! ]7 a& p. C2 M. F& xMcNemar检验
5 T: p- ^+ l+ q8 a9 U) E) K4 D6 K3 u1 O4 M7 G; x9 Z
卡方分布的解释。
# ?& z/ A0 Q# V+ vMcNema检验是一种列联表的同质性检验。0 A* n8 \# D! i. `
, ^! L" \4 U! [! M
- _: Z3 t/ P$ J
1 F$ V d& A( `7 Z" Z4 a+ |$ H一个数据集比较多个算法的检验& z) n, J6 A5 d/ f9 ]0 |
/ }: D s# w/ c8 z, h# S
两种思路:
" g: e+ g0 N6 k+ B" v3 D# ~% A+ y" g C2 D0 F
算法使用上述方法进行两两比较,直至产生结果。
/ M" n6 _- v2 j( o# w1 I对算法结果进行排序,如Friedman检验。/ y! S% e. \4 {
Friedman检验' L, }& t! t: s7 J
, Y [7 ~' r0 U先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。) M: R) y$ N/ z- `$ N
b6 h$ @( q% {$ X& h+ V" P; G
0 I- _; g' D0 y; u- e9 ~' C
% r% H3 ^6 E4 m/ _9 ]2 D
Friedman检验图
8 n2 o& C, w. z$ ]$ r
3 m3 w# s+ o- E0 F5 d$ JF检验常用临界值6 ?8 D2 v# i3 V. K* o
4 G% b% N1 b* ^3 v' ?( q8 |Nemenyi检验常用值
( _: q, p5 A* |7 h/ a
' O- [0 ]& c8 \: L+ D1 b9 u* G N& p# ?
————————————————. ]; f6 W2 L9 f1 Z0 V. R% N
版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。9 Y# ?, x/ x( x1 a
原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
+ _0 O9 a" X' D3 k& T$ k) v) k- q' j& Y w$ z5 p
0 C! p X0 f) W3 l% C. Q" _6 W
|
zan
|