数学建模社区-数学中国

标题: 使用统计假设检验验证 [打印本页]

作者: 杨利霞    时间: 2020-5-4 15:18
标题: 使用统计假设检验验证
使用统计假设检验验证
; H# a0 u6 _# ^. H, s文章目录" p+ Y7 a0 P% o# ^0 a. T: Y
( P: L% ]3 m0 L; u" ]
常规检验
7 Q. R, m% v- W' V5 P$ }  l二项检验
. {2 ^, C. {% o, Dt检验
+ q- t/ E8 ]1 j1 T一个数据集比较两个算法的检验
& n7 E! R$ Y1 @' Z" B交叉t检验6 @5 t! F5 n/ h
McNemar检验% u4 F: b: b- U. ?" T' U+ m" F- }
一个数据集比较多个算法的检验& p  F, Z& `' H1 i( g9 j& X- ]: b: S
Friedman检验3 C/ i1 s  l* u. c( W+ @
Friedman检验图
% D: ]- w; y& i- b2 g$ pF检验常用临界值
- H5 x, z/ h# r3 zNemenyi检验常用值
5 m+ N: X7 }: _1 ?- Z闲得慌
9 A: F+ Q' j; c  y: e! u统计学是以小样本来估计总体。
+ a, b& M! m* ~3 D( |$ J: ^
9 m; Q' a% u( w4 Y& |在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。* |  ~: E/ x9 g3 g* m
- e( S) X% h: a: T5 G4 \! o
常规检验) \  c& f* g- m$ i+ f
6 B: d  q+ z5 z- @
二项检验) |& k) l/ g( V1 C
  ~$ d4 N8 U! I! _" ~# M# }8 g
假设检验步骤及二项分布的介绍3 U6 v4 J- K/ O4 y
1.jpg
1 x  T1 ^0 x+ f  b' p; @4 S, A5 t: ^' `
) E! x1 Z* I: `6 p# J' s
t检验  C0 z4 G% |# N& L- F- _

0 K7 c. }/ u% s, s3 O( V" @多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。
3 v6 w* j, k0 nt检验可分为单总体检验和双总体检验,以及配对样本检验。
* l$ D) S0 _- c1 T/ ?; a三种T检验的详细区分。
- L% b& p4 }* A6 l4 }' Nt-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
- X; j9 g2 k9 z4 C3 t$ i4 }/ l7 M0 k6 h. j  [
一个数据集比较两个算法的检验% g0 }* r# [4 x9 f1 k

5 F/ i$ V8 J, f, y交叉t检验
9 n9 r3 y" y) l! f+ e5 L! c6 }3 B  V2 U8 K$ j+ P* @
交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。
" y& a. j& V, d1 A2 U; J+ P基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。
7 [- [% J8 `( I2 m假设:学习器性能相同。+ {0 X1 D; P$ c; e
3.jpg
" G9 e/ K% T- H2 C/ W/ h" ~( c" I; j/ Y4 l7 L; ^$ U
6 X- m% W' f2 z0 O, o  x( _
McNemar检验
5 t% U4 L9 U" r' O/ u1 [1 u' ^, P7 U: {. O, J! E1 x7 e
卡方分布的解释。
; d' h) C4 ?. d* ^  N4 X, H: [) RMcNema检验是一种列联表的同质性检验。
3 B4 k) r- K, D. I0 A9 _; I9 L  P* H* w3 M7 n, W
4.jpg
1 I  D/ u) D& y- P! D0 a: K
: h+ D4 O9 b5 ^& @1 p. }  H: @一个数据集比较多个算法的检验" Q/ F; {9 R( K
  `$ k$ C' D% V( p( S, }
两种思路:
: t5 n0 n4 r" F  t' ?4 \- H5 v& z( C2 A! ~* w  U+ ~( C
算法使用上述方法进行两两比较,直至产生结果。
# c1 ^' ?+ \0 I9 Z1 v+ x$ {& z对算法结果进行排序,如Friedman检验。
, Z$ U5 f) Y, o9 N7 pFriedman检验
* \  M$ ?! V) L1 J! f% p' R. ?7 j$ L5 s7 U/ l6 Y- H
先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。
! V( H! W, u4 i- \1 Y
. C$ u; Y- a5 u! |# b0 ~) ^4 h 5.jpg
3 g, c! T% ], ]# y2 x
8 W6 u1 X" E: a9 o3 l7 CFriedman检验图 6.jpg 1 E% g% `' w4 n; {! ~% r2 h

: O  b  B( r( p; Z& O" IF检验常用临界值
( j: y; r0 z/ m3 `' o/ u( g' {& t 7.jpg ) _; u4 G4 d" x2 d4 g( p2 w5 X
Nemenyi检验常用值 8.jpg
' y% g/ N& c! w  m  N* s- r! U; v' o

2 j& J+ i3 \, N3 [) Q1 `————————————————
1 K2 y$ K& A* _版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。' R4 a; l, t7 U# y: m+ s% \9 S
原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333% e, o5 B6 v; j7 b9 Y& F/ p
' [* N# S1 ^2 w" O
; n: R( E. G, e% z* Z





欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5