- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563371 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174234
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
使用统计假设检验验证7 E% J( @' @, }& A) ]
文章目录
+ S N% P5 t" J9 b( `1 Q6 b2 w& r& _+ Z2 J+ ?
常规检验
u: y+ O5 c9 T9 @- f4 X二项检验
0 J+ g, C1 [2 e. \6 r0 N; [ Kt检验! {( l J2 g( \5 B* ^! u; w! j
一个数据集比较两个算法的检验; k: }9 `+ q2 }' [8 z# I% \. m
交叉t检验
8 z/ x7 @9 K; G( j+ i, O6 qMcNemar检验
1 B: T; s5 h' w) w% V1 c' Q一个数据集比较多个算法的检验
8 l' b, E3 Y) r1 R& yFriedman检验
4 X- D& s; ^& v% c3 T3 V5 V' ^Friedman检验图# H' K/ ]4 j. x" X; Q- h
F检验常用临界值, _ T) \/ m; e! x6 v
Nemenyi检验常用值
9 |, H" h! f7 w6 X8 }& M7 n闲得慌8 @6 q m$ U) S4 Q! g- A
统计学是以小样本来估计总体。8 F4 V1 `; }( A' t" n5 U
: I, _" Q6 G1 J. Y0 i) K
在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。
0 @6 H: y. e1 F% K* u0 I$ w, z
4 t) t9 v, g3 c% G常规检验
) r$ H/ r) D. Y# g5 d+ U( T: w1 Q+ T* ~3 L% a1 ]
二项检验
2 _6 T$ L& D9 e) _0 |# C$ L. c6 F# g" }5 f% K$ Z
假设检验步骤及二项分布的介绍
) w* e& N& s Y! S
& y6 o% |- ]; W) e+ n, p5 o# }4 d2 s2 u; Z# ]
6 B+ E/ F5 O6 O4 Kt检验6 {! z: c% T7 c7 ]4 B# v8 f
4 b1 E/ B2 `1 ^! m9 _多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。
; l! r: L3 k# B1 d( Y4 m0 zt检验可分为单总体检验和双总体检验,以及配对样本检验。& x6 c' J7 o) k7 _ u( O
三种T检验的详细区分。( c# w4 h* C# h; t
t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
5 M5 Y7 ]) _$ k( `2 k. k5 F+ x2 W( |8 ?8 P+ ~/ ]! `! K8 [9 q( l
一个数据集比较两个算法的检验
! ~# D9 }# \4 V
" C a. V7 H, R交叉t检验
: V' T2 S" | n: N/ E* i$ @. u
' N1 c& }- ] ]" F: s交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。1 U7 v8 I* Z o
基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。
" I! p) u7 W! ]) I5 ]" e: X假设:学习器性能相同。
! _. h2 f4 ^( C2 s/ ]
; {0 t5 e2 c. @6 @' m8 G4 H9 b0 b1 R# R: K. s# R6 {; u& ~- ^6 {0 H+ X
7 L: |, |" r9 t+ @. yMcNemar检验- y o; y9 \1 X& r4 q
' a. z. V; |& Q6 j4 |
卡方分布的解释。" J" g- u3 o$ ^) q u
McNema检验是一种列联表的同质性检验。+ Z/ X- L# R! q$ ~" j( Q
/ a9 [+ ]5 g* U' O
) v p3 `1 J1 d# ~% N6 F
+ b/ f$ k9 ~) v3 |% {' G! h一个数据集比较多个算法的检验
4 o9 P3 h8 `* ^. }6 _2 T* ?
! c3 m% K: ~% V% `3 s两种思路:
& l- R( S8 Y/ c8 B) k2 ?) A6 Q9 _5 Z! ?
算法使用上述方法进行两两比较,直至产生结果。
; I" K5 C8 U+ e" a n" C7 P对算法结果进行排序,如Friedman检验。
# f5 z* z' Y+ rFriedman检验
# g2 E1 d% E- m4 H: q# O& I9 s# F4 Z5 s* ]4 m
先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。
' f8 H B1 }+ c/ Y+ z
3 X4 O9 g/ N- G3 \& d3 V
! ` B" Z" ^8 m+ K2 |1 w- o$ u }: O2 ^# e u9 `
Friedman检验图
9 K- \; W& y/ c' e# N
% ?- R0 t$ d; i$ yF检验常用临界值
5 ]# A( S3 X1 g$ N4 f
8 `5 h* Z! ?. q, o
Nemenyi检验常用值
1 b4 {6 j8 z6 s6 J+ i' u* Y
/ q' ^/ ]; G1 l( [1 Y& z0 l5 {
$ `! Q( s: I S2 ]/ ~) q, R
————————————————
' |3 n( k" ]* N: t版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
& \, |1 o3 v% m1 j& g' N j% @; H8 u原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
! r4 \' ?" x0 o0 p, ~+ ^, |7 a9 e$ J% b2 W7 A' }0 D
( o! T6 W, N5 Y9 O3 t: Q |
zan
|