- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 557110 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 172506
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
使用统计假设检验验证. g# l% d2 @, O
文章目录 U. `* V# y! C$ b# \
6 q2 g6 L2 A; m7 P+ d常规检验+ ~! C6 v$ O9 n1 r
二项检验
$ f+ i( \2 t0 `& [1 D; |6 O" nt检验: Z/ R" J1 [$ D" {
一个数据集比较两个算法的检验' v* `5 m. k8 y' U* Q
交叉t检验/ F5 |6 e V; I9 j
McNemar检验2 ^$ S. X$ S0 v
一个数据集比较多个算法的检验
) `3 m# T( C/ u" @2 FFriedman检验
( J; e' Z6 V8 {: r+ w% x! LFriedman检验图' z# b0 @* E% J" ]
F检验常用临界值7 A. |/ m' G2 N8 H* D
Nemenyi检验常用值& I; _! P* c% r" h
闲得慌
9 ?$ y" V! X; a' Z5 L5 ?5 a/ Q- h统计学是以小样本来估计总体。
1 L6 L! Q, O5 X1 O; h8 x: B( r, r6 ?8 O/ ?8 a
在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。
# n& G& Y7 t0 m! c5 Z+ ^; M) k. \9 P- H! _2 E( U6 J+ I
常规检验 ]0 A5 O0 `1 ]
& f5 J$ @* R q; s9 G: V8 l
二项检验
8 N# ]3 v7 k8 @. ]& O1 V( H; Q! b1 ]- x
假设检验步骤及二项分布的介绍/ t" H8 M/ i0 ^; q
4 r7 z5 P2 T1 V! V3 v6 K! o
" a% ]+ K0 c5 O& V3 A2 R% f. L0 T( b# L; W0 ~, ?/ D% g
t检验3 a# S) d9 D9 B( c5 {3 w+ i
5 {- h0 z* \4 ^1 D5 I5 `多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。+ G- V! ]) B, c, N! X7 i ^
t检验可分为单总体检验和双总体检验,以及配对样本检验。$ J. N( O0 ^% H) @
三种T检验的详细区分。
+ T- u& @, e0 [! Y$ et-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
* t& J* G: y/ |1 V. p2 q$ S, i$ Y! r( v: f
一个数据集比较两个算法的检验- J$ ]% V5 |4 I4 b' W
b/ F7 W. Q9 C4 d8 ~交叉t检验4 S ]6 F- `$ F3 d
a* t2 w) y) B. y4 d交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。
1 H( @7 B2 D ~# K& q4 [6 i/ R7 Y基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。+ j% V/ y: Q& ]/ U- S0 s
假设:学习器性能相同。" }0 T& m% C3 x
' D5 j2 w8 a. G, \+ d9 a+ L+ l4 Q, }- t% N9 A
6 @8 N" o9 R# i$ ]9 c; C. QMcNemar检验" h; ^+ w$ C( c# P }
. i! L& U3 J/ n+ G% _卡方分布的解释。
- L( w6 f5 Z7 Q0 }. C2 Y" [McNema检验是一种列联表的同质性检验。
1 R1 E$ y" D6 R, {* t6 y3 B O. B* r
5 K5 w% ?+ M. t# P; B" L
; W2 h6 b- e& g+ {* \一个数据集比较多个算法的检验% T' D5 B% I0 q$ J
: y8 \( ~% N2 |- v( n两种思路:
* d2 h. s+ k) d; D2 L( ?$ H" |
算法使用上述方法进行两两比较,直至产生结果。
9 O* X5 z' ^$ H& ^# |: J对算法结果进行排序,如Friedman检验。
/ x; y7 |# E3 g' W3 z' o3 _Friedman检验
0 T9 @$ ]# w2 ~, f3 _6 m# @; t2 o8 F4 Z w
先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。. u. v U% i: k2 X6 u9 g
/ @6 N9 g! E- m7 T
; i+ R! a. D; ~* g# l
7 i( w) r3 p7 l8 ?! S+ {% K- ?Friedman检验图
& [+ A, n8 D5 W/ R# v9 ~, A; v- ?6 X
+ r9 Z( j6 X4 x4 YF检验常用临界值: @6 ], n5 T; S" K! i
8 k, W! O# d+ p* K
Nemenyi检验常用值
4 T! Y* P4 ?& `* X
) q: h6 l, T" m' O/ i- R% Q Y. ~, X
+ d1 t* r0 ^6 T! d————————————————- \( I1 F" t0 w
版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
: b: _) A# d- z9 J, m原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
4 y3 D5 R0 |9 Y3 { M2 t4 w# B7 \. F* X" {8 b# D2 e
9 h+ C: k7 I) p! W4 U
|
zan
|