- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564563 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174592
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
使用统计假设检验验证
+ A" g$ X3 `6 e. G9 {- o4 _文章目录
$ {+ q, \4 n( A$ u C
9 X& O7 w- q! n8 q" X( r5 c# X常规检验
3 Q, S4 o* y6 E二项检验
5 c6 A8 ^0 F4 `) Q* ~t检验9 @1 p6 Z% R: q: v' O) M( Q" v
一个数据集比较两个算法的检验5 \5 v! `9 e+ h
交叉t检验1 C! ^) {& d# Z( c+ X" b
McNemar检验, a3 O/ J4 x( d6 j, d
一个数据集比较多个算法的检验
: b# q/ ^% Z3 S. I) H( YFriedman检验
5 z1 h- b7 }: x0 t( G) w% aFriedman检验图
/ N7 R. ^% d4 L+ v2 P2 Y4 oF检验常用临界值) x" E" R; E, V) T6 S, V8 ~2 u8 R
Nemenyi检验常用值; I0 X- ~6 V F$ i! G6 b0 G5 L
闲得慌' ^2 M8 t: M) |9 k5 n- i
统计学是以小样本来估计总体。
0 H) \( I: R1 ~4 U1 e3 e r* s. b9 R9 V; l# d' U
在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。
2 h9 ^+ ~+ }+ {2 `' L8 x- X; k5 E; b1 r# l
常规检验' l4 E) g# J4 T8 h
' K" S+ p! Z2 r- [: M; b二项检验
! A9 v% S' k5 g. }! a' Z# ?, K1 O3 z; T0 g0 }0 K) C) C2 }
假设检验步骤及二项分布的介绍
4 e/ p; r6 l1 x" p) J6 `
2 s+ y$ \( p& p2 S
2 {4 t! }4 \( Z! [9 B2 t2 U: h; j( s& x6 p) c. B
t检验
! _7 X1 ?* \) E% g# m1 Y7 B
/ m9 r0 W" L! R& m3 i6 W多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。
2 A1 r5 v, S; E* w' u# A$ Kt检验可分为单总体检验和双总体检验,以及配对样本检验。
: _ e ~. c% y# e4 h三种T检验的详细区分。$ W' H- n3 B! w# k/ a4 `
t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
d2 s- p' [" @7 E" c' H8 j! Y* \4 M* X) v0 s
一个数据集比较两个算法的检验- g$ j5 K& u M' @% Z
7 `" e5 Q6 P- G& d5 j, n
交叉t检验
2 O6 d, w9 T2 U" u0 t
% M2 m$ e) a O( T5 _交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。& A" I8 g, g8 W1 E2 k1 `4 B
基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。/ G5 b! e0 S T( U( B& s T/ T
假设:学习器性能相同。
3 ^& q! K2 o6 H7 D" H
6 n; K2 Y9 \7 i6 z, `
3 p F" C* j T! C& m) I, j* w' P0 a* a
McNemar检验
* y1 {, w) [( l4 H. I3 T
0 d) g, ^% L4 |1 ~9 z$ o& S% n卡方分布的解释。# E" q1 ?2 Z) ^( _
McNema检验是一种列联表的同质性检验。% S$ W& z0 S/ d, y6 H9 @9 t
6 Y W/ e% f# @
& V0 h# A0 G$ v9 Z, }% B" b
) `' H1 G4 Z% ~2 Q$ T一个数据集比较多个算法的检验: s; r' K `- u" B* |2 H
7 |3 c! |# X: ?* v1 ?两种思路:1 x- E& ?6 U: I1 [3 Y f) z$ P3 K
4 S7 ]. F. v$ w算法使用上述方法进行两两比较,直至产生结果。3 n/ A+ G3 e* T* W
对算法结果进行排序,如Friedman检验。: N2 H! O- \9 l" |% T( _
Friedman检验* U( V5 r- f4 x, M; n
6 ^+ N% q, M% ~8 I$ p先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。# R' K6 `$ v! J" Y& J& u
( _' Y8 `! F2 F3 u
/ u, A* G6 S5 d+ u
' x7 G k9 ? @( |5 T* l6 SFriedman检验图
! H+ l) P4 a9 a/ q/ c% u0 N8 |$ |) K. W3 k& [ w4 p _
F检验常用临界值
- g. N' ?5 {4 L& D5 {; w0 c
/ B; V# C# W! f2 _2 v
Nemenyi检验常用值
( R+ Q$ A: q" z6 G1 w
% t7 |5 x/ y/ b% g1 j
1 P( ]/ J" \$ Q6 W6 o) D( G———————————————— X q8 a) V# Q& g! B" V6 O
版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。; ]8 |1 y6 M" V" y, _0 _( s) m: {
原文链接:https://blog.csdn.net/qq_35182128/article/details/1058863336 ^9 D9 c) I- W, I
; z5 x* V: D' x; |- }; q: J( t& w% |' V0 d. K# O8 x' T1 |
|
zan
|