- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 556433 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 172303
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
使用统计假设检验验证/ E+ q/ B0 A( i! Z% W* }( K
文章目录. O5 S. m0 }: e7 [6 A# L2 {
) v3 w' ?% y) q+ ]
常规检验
! X9 o9 w3 g& |9 ~二项检验* B" I/ D* w) j: M9 N
t检验
0 k; \( `8 @4 D' }一个数据集比较两个算法的检验, G+ c; w3 ?3 o/ q" x
交叉t检验
) @8 W: ?4 m) V! G6 d, ^/ b: HMcNemar检验( O A6 C5 W+ c* o4 b
一个数据集比较多个算法的检验3 I5 A2 b7 t. l$ h5 L
Friedman检验( Q- d0 E s% K/ ?
Friedman检验图; ~8 u- |- {* K( S3 A
F检验常用临界值
$ x3 M) m1 k- h1 f# `8 Z a4 m7 J) y, m% pNemenyi检验常用值+ \. _9 [" M( S9 w b
闲得慌) H6 g8 B* m3 u: e9 |
统计学是以小样本来估计总体。% t% f' b$ m. W! `/ @- Q
; ?% v/ w; U9 A在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。9 a/ Q1 I- j0 V# g7 {
& }. t6 F% U# V* Q1 }, e: R4 p* ?
常规检验6 h; p1 r0 C2 F& R' F
9 j0 [( N3 |- N2 @1 K
二项检验
Z% L3 E8 [/ k% q
8 v% M) G6 Z7 v7 {假设检验步骤及二项分布的介绍
2 D5 r( e& p# \7 y- |
" k/ f3 x# S# e' p. s' C
2 {! r0 @1 }3 I5 r0 j) D* {7 q
3 g m& K& z* z6 v6 ~
t检验4 p9 U M" P4 ~- h+ ?! z0 E/ {
/ Y! U3 c5 M; h& a3 k! X1 t. z多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。" M6 S5 O+ i' [7 P" C+ U9 v
t检验可分为单总体检验和双总体检验,以及配对样本检验。5 H0 @+ L. j; {9 F, b! E, F5 M
三种T检验的详细区分。
" I8 t ~8 z: @! Y: yt-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。7 H0 U& O9 G0 h, I; [( U
$ l. h0 m$ p4 x: s2 I8 m
一个数据集比较两个算法的检验
& m+ E& L+ B: O( Q% M# U1 y9 j' g0 p4 J) s( X- P D" Z" G+ H, N' C
交叉t检验
) D. \! T* F& M# v' d5 }6 p1 c \& @1 B; K; a
交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。- t$ s, ^8 p" _4 T- a$ k! r# k9 y
基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。
% `5 o) U- j9 n+ B s% V假设:学习器性能相同。4 M M8 ?' G; \5 u5 z, i `" r
1 r- s9 `) g; \) r
0 Y7 Z; b& n: n8 V _0 J, ^& k, o( Q+ ^0 u8 F, f- z, W& t, I0 ?
McNemar检验
2 @' a9 V0 ^5 D7 q% P5 H: v) o
" ~% v: D- P9 P" |卡方分布的解释。
) r$ \5 x+ \7 LMcNema检验是一种列联表的同质性检验。
3 I! F) c" H; o9 N% N) F5 a# U
2 k( M8 j5 c# v6 M Z" L
* y- `6 \. z5 S9 b- L3 r1 s0 X
3 R% x2 H3 n* y i5 [3 f一个数据集比较多个算法的检验
: ` T. u# u! U- v k2 s4 ]' a2 k, b- l' n/ @% W: x
两种思路:1 N) Y! A' G3 n& }0 A- |
9 |- b [4 e% J
算法使用上述方法进行两两比较,直至产生结果。) ?5 w& y8 e1 D2 w- Q! J6 c0 K$ S% g
对算法结果进行排序,如Friedman检验。
. x/ y& V* }9 nFriedman检验
2 Y0 p& E* p. | D2 ~+ Y3 ]1 p' y$ t1 D$ B# G( a
先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。% X7 l2 r3 C3 i) d' O. N& E& _
7 ^4 O8 x9 ^; a L; S
9 b/ A% b& C- Z! _
6 X% r% L' Q& Z/ N
Friedman检验图
0 U+ }& k4 T2 B5 g; @- C3 z- S3 p" k) u3 {& V$ u7 b
F检验常用临界值: O' Y& D8 Y$ k! r7 B0 Q' c
5 `2 S; P3 u; L( }, _2 g0 m* n: U" d
Nemenyi检验常用值
# }: s J2 r V( D( V( U7 L- a2 S. T# ^
! l$ r( q2 ~0 K. J6 i. U" e
( X; u: p2 K4 G1 U3 t
————————————————
% \7 l2 B4 T! P1 o6 G: R版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
* Q* b% d3 @4 ]; w原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
9 m, N" q; G6 Y" ?+ w2 ^) ^3 R& I8 n9 G) e! M+ U
) {5 Z! @! G$ ]& H$ j6 S, P( c2 c3 L |
zan
|