- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 556919 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 172449
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
使用统计假设检验验证8 y* g. y8 i6 u' M5 i# L$ {
文章目录( h2 l+ u4 Y% t# I( w4 s6 H
* b8 B( F5 e4 S, D/ ?* V* w R% h4 J& |
常规检验. w4 I1 x2 w8 v' ]
二项检验
4 u7 B$ a5 M, A/ jt检验
3 D) e# u$ \ {5 y' R一个数据集比较两个算法的检验
* S, i4 n2 ?; X7 ^8 A交叉t检验 }4 t6 K& U9 I. q* {' [6 }
McNemar检验* q* y4 X7 ]4 {
一个数据集比较多个算法的检验! z& M; O0 J# _6 @! L
Friedman检验
M: g& C, f; ]6 t# c2 kFriedman检验图
) ?3 @6 V& l) {$ Y$ \" QF检验常用临界值
0 G0 \3 d" X; Y9 ENemenyi检验常用值: R( ]/ m! F8 o
闲得慌) ^( p* \- T Y7 k2 ^2 ?
统计学是以小样本来估计总体。- O% V, B" P! o \: }6 V( s2 i+ M
1 }- D* I8 V7 Y: }) H0 R! z9 q在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。% p$ i) }6 {3 B$ f- g" R
7 C8 r1 N* l ]2 R" r常规检验* {) f7 E' U9 G* M9 w1 T8 i. ~7 |4 Q
. Y* F- R) W! U @* } t二项检验
% ` d# F/ R3 Q# R. Y
) Q: w q5 s5 S" o, J5 s6 l假设检验步骤及二项分布的介绍' n5 \ i, z) Q8 G. J7 R+ B
) Y0 U {3 `. D7 t
2 J, T, t& p) Z5 h- b2 i5 K/ P9 j! A5 _
t检验
8 o6 \, ?3 L9 K+ ]' d9 A( @
M* q6 e% [+ k5 U+ q0 b多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。
) a3 O J# `% d/ x. z9 jt检验可分为单总体检验和双总体检验,以及配对样本检验。
x. a. N8 u) R6 g3 @" o三种T检验的详细区分。. ~- R) M7 c5 P2 a6 Z1 {
t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
& r5 h) m/ i) T$ K9 [2 S: F( }7 U8 d" e# X
一个数据集比较两个算法的检验
9 h) Y$ j G1 f, N3 L. z3 k. o- D" D0 `8 u% {
交叉t检验" G4 C& f7 M; J( N2 s
- ~ q1 m9 u$ d
交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。1 x( c0 ?+ U4 N9 u
基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。" X) N+ e: a3 ^4 D9 Q. G; p! S
假设:学习器性能相同。
: X7 U( A7 b0 F, W+ N
# v! Y% ?: o. Y6 g. K
- v3 `( O$ N$ ^8 a7 }
; U$ \# y$ Z+ e, z" F% L/ D
McNemar检验0 ~) W6 s0 U) j0 d8 C; N8 ~3 k
$ N( p# P& C1 z; } G+ k) \8 {卡方分布的解释。/ r# f E) M2 k. h0 `8 K5 c8 ?
McNema检验是一种列联表的同质性检验。9 M3 D1 q* n; p8 l
- x3 n; N0 \$ M/ _# I$ a
3 U% H! _9 \( T: l+ i/ P+ S7 h# \+ v3 i( b' D$ F' [
一个数据集比较多个算法的检验
: F4 o5 t8 c1 V; R& w' z
4 R0 C6 T. Q5 u6 g, C, {7 Y两种思路:$ F7 u+ X0 i" q7 O5 V5 W
' e8 f f) t% r
算法使用上述方法进行两两比较,直至产生结果。* p; F8 l; }) W7 M1 f2 j q
对算法结果进行排序,如Friedman检验。
% `9 w9 a) u1 L' m& _. ^Friedman检验
- F9 z( G( H8 D: T7 O& l" U7 M& W4 ^ P
先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。
) @9 F& j# E) F
0 M5 z: k X1 F0 Q* C6 {
' h& x0 g: m; O8 J$ l: G1 W7 k2 l; x a: G4 l, i% i" D! t$ g
Friedman检验图
1 L# n8 B4 Q# a/ v( r
" }. `5 t- ^* B& e% O
F检验常用临界值" _! t' y3 H8 i% `+ z- X% m
+ Q" G8 d3 a5 E( z: gNemenyi检验常用值
9 n2 [* U ^# z: F* E8 ]6 Z3 g4 r
! Q: p/ p) z5 `7 }" |# K% G
) N9 u% }9 B+ B! \; c
————————————————, R% j7 y+ H) |2 m4 S/ C, a5 l
版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
0 q. t' [: L- J" @9 |& D; @原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
7 {2 b. J% R+ K
( n- C& v# B3 ?- `6 }( L
! w8 O h: Y! d: | |
zan
|