- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563370 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174234
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
使用统计假设检验验证1 k, w# f" R+ v i% X: O+ V
文章目录* @2 Z# K) U6 [% N+ Q/ y
: I8 B8 y* i' c. v' ^) G. H2 B" v! o
常规检验. F* S; X! E$ d3 k e2 a2 U0 m8 H
二项检验$ O7 e# k' v- x1 v- B
t检验
) c/ z O6 A5 l, J2 X一个数据集比较两个算法的检验
# n4 u# J1 r. f0 u! {5 {; w& m9 O交叉t检验
$ b3 ^- ~5 K4 z, IMcNemar检验 ~& J6 }) B# U ?- f
一个数据集比较多个算法的检验
1 z3 G- a" V3 M0 `3 [1 Z& ]# pFriedman检验
3 Q6 c% F' ?4 [/ vFriedman检验图
4 E- F$ \, p- ^7 X& bF检验常用临界值
" E+ s* C3 r4 J: CNemenyi检验常用值
+ E9 C2 Z0 [, O- C+ y( v/ [' a u1 I闲得慌
7 `% r0 ?* M& `; t统计学是以小样本来估计总体。
* Y1 m7 u+ B" e# v
2 z1 H6 b2 h, D在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。
/ ^3 @ h/ t* m, [1 S# ~( J" T! S& e
常规检验
1 `9 P' ~8 P+ t! e! E. B
6 I8 P* _0 G4 k* x7 g& u% h5 J二项检验
2 f5 g3 P. v9 Z5 v, v H: c8 C, k
假设检验步骤及二项分布的介绍
' m a9 S# y" w9 R
8 Z, S3 u. I2 W
8 A" W. w0 [% T! b
( i0 M' I8 @0 n% wt检验
. x$ l+ y3 k! s+ b
% B7 d# ]2 @8 J' B) Q9 U1 H多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。 k1 D1 W4 B* e' ~) c4 B
t检验可分为单总体检验和双总体检验,以及配对样本检验。
6 k$ y ~; D5 e9 Z8 p/ O8 _三种T检验的详细区分。
% F4 t3 j e4 R7 Wt-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。$ g, w0 T# a, B8 t% ?
+ I) x1 W0 \# K0 B9 h8 e一个数据集比较两个算法的检验8 J, a( ~: u% ]; P7 z' N* _
9 j$ w, H$ q8 k3 ^
交叉t检验9 ^" X* M3 h/ e2 {, |
& ^' u1 I7 }1 X- O: W5 | q& c
交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。/ f% ~# u2 i6 Y0 [& w
基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。0 X1 B* o7 H, i5 {, e
假设:学习器性能相同。
+ G; O S4 t% z9 A' y
' D7 x! S: @6 N$ ^
- k3 F* u# q, F' g% o
b: x6 t6 B% N2 j
McNemar检验
- N! K2 N' A# H/ c: l( z' ~3 `6 ~7 H. v$ R% x9 a/ Q9 E c# }
卡方分布的解释。6 H. k/ S7 w, a- c, Y2 ]& d1 T
McNema检验是一种列联表的同质性检验。6 \& c) | c. T/ ~
( w: J! a* e+ v# w8 s( u, ?
2 N! _/ \' t$ I2 Y6 }/ N
( x* Z, n: h$ o1 ]% y2 a一个数据集比较多个算法的检验
1 Z8 o% E ^% O* r( p! N4 ]( ?& a/ u1 C
两种思路:# U' m+ Y3 h$ d% Z( `
! ~" @1 Z% p, }6 q8 c, _7 n* z
算法使用上述方法进行两两比较,直至产生结果。
& v% O9 n: \; o! i对算法结果进行排序,如Friedman检验。2 c. H3 b2 m& W
Friedman检验6 f. @9 Z: M; d* O1 e' k
5 k' k: B" F6 Z8 I( K
先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。
/ b- ~5 X) d8 r
3 J) ~ `. X2 C. ]7 P) f/ J
( t0 O( P% }* Y# [3 e! |' I/ x6 L5 j! A2 ?8 O7 E5 f# \
Friedman检验图
4 D- x$ t% d0 I [, d3 }3 J: o8 @) V0 d' H' q& [8 I
F检验常用临界值, ]( V) _. s0 G! A, u$ O: @
5 o9 X' A; V& W: @6 w! V$ o
Nemenyi检验常用值
) T# w. K c1 \4 J; z* |! z; q8 x
( c# H0 U; ]/ X, L# w
# F+ p# @# L% [: ?" C————————————————- S8 Q" P8 U4 ?- X1 @ b
版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。 H1 @- ?" E5 W/ V& c @
原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
4 O; ?8 z1 P- S5 r! F3 ^$ q; I' Z6 u# T }+ A3 V( H
! j) r k1 w {# a |
zan
|