QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4461|回复: 0
打印 上一主题 下一主题

使用统计假设检验验证

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2020-5-4 15:18 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    使用统计假设检验验证* i, J$ d# G4 b& M8 ?
    文章目录
    1 g( _# L4 a  J5 V3 l- v: ]/ h( ^; X" E0 C( g! g7 @) ^( i
    常规检验7 C2 E9 K2 k0 z2 }+ Z* t
    二项检验
    " w' `; d3 ]% T8 E7 r9 W! p' ut检验/ o; H  Z- u. g  t- v' o( Y1 S
    一个数据集比较两个算法的检验& Q. X. J" D2 Z8 z6 X
    交叉t检验8 L" A& s" }5 o( c3 {
    McNemar检验( s2 D6 p4 Q- e" B$ j( ^4 b: g
    一个数据集比较多个算法的检验" h- o7 b* J0 ~; i
    Friedman检验
    # _. b; ^' d3 m5 R& T; c' a8 yFriedman检验图
    * ?) O1 ?0 z8 m! o' p# eF检验常用临界值( W) @3 H8 e. M/ J8 Z" P
    Nemenyi检验常用值
    * h7 k' ?( Z% B9 u: {闲得慌
    $ O; ^+ p4 V1 X7 B统计学是以小样本来估计总体。
    5 n/ F5 h5 B- U# h. ^& w% l! }
    4 s$ ^% [# U+ ]6 z在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。, L, V" p+ ?% B7 v

    $ S2 o9 p) L% z# R0 w8 Q% c/ g常规检验
    1 E* p8 s% k$ h4 b% n( f, U6 H
    ! {* ?5 ~# S* X. \% i二项检验
    % K* ~/ t) {2 J0 z5 S" ~% N
    ' \. _8 j0 m% K; p0 o5 m假设检验步骤及二项分布的介绍3 Y3 x" ^9 k3 [# ^4 w
    1.jpg 7 t1 j" J6 u$ w4 f8 {" S- l

    ' r! d- j, R3 q" m0 |2 j5 c2 G. K9 V' |% C8 }. n0 T: q
    t检验0 C+ N8 n' h  s9 J  {
    ( K+ A$ e# d9 X, t
    多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。# X6 }4 I4 l& j+ p; P
    t检验可分为单总体检验和双总体检验,以及配对样本检验。
    5 H3 ]( ^) P: i# p三种T检验的详细区分。
    3 K9 S! Y7 {  m% a; ?/ l' ct-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
    2 c; _7 z+ q4 R4 r. `5 ^) E4 ]7 {* f5 A
    一个数据集比较两个算法的检验
    6 _' T5 a7 C4 Y& A; W# S
    : X$ U+ }4 T2 K  r& n. u交叉t检验" k5 Q5 Y$ a2 u, r- E& }

    9 k& q; X; m+ y# I交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。
    4 E3 G% f4 b+ a$ U5 n' _基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。  M6 }: r7 X) U( @4 O
    假设:学习器性能相同。
      c0 l4 w* {: R2 l* R$ h 3.jpg ; a# M8 Y) C+ Q/ o: l

    5 A9 f8 [1 J4 ^# y& W. f0 h9 X6 e4 B/ g1 S* E
    McNemar检验
    0 e9 k: A. p5 t" g7 D2 R; K& [4 e% _9 N) B
    卡方分布的解释。- Z2 m* Z. S; E% E- Z9 N
    McNema检验是一种列联表的同质性检验。
    * C1 G0 M* ?9 d; F6 V
    " R7 Q% S/ z* R  C( P 4.jpg
    " a$ V+ g0 Q- V; j8 C8 f5 [, O4 r% D  d6 t
    一个数据集比较多个算法的检验
    , }$ _! K, T: L+ V/ O& c
    * i; E2 S' H& s% N' W* S  m5 m两种思路:! H* b6 p6 z2 k$ S0 A  m

    " G/ Y8 m4 `) e1 I* W" M0 Q算法使用上述方法进行两两比较,直至产生结果。
    6 l! G% F+ Y* I9 j0 Y2 C  r3 X对算法结果进行排序,如Friedman检验。7 \4 j1 {0 {" A1 Y; a# N0 A
    Friedman检验/ ~2 I& f; D! [% F/ b7 w

    % }$ w* a+ I' ~2 x1 ]: N- H+ ]先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。
    & `9 P' E1 N" R  c1 \$ J" _8 ?$ P0 J
    5.jpg 7 r3 W. I; }) j+ @  U1 U

    % l2 q1 r& f) o+ F  A3 rFriedman检验图 6.jpg
    0 N) x; n( T8 {. b* n: L
    + o0 ^$ ]$ M" @9 ~4 lF检验常用临界值6 M. e8 U% ^. u7 ^
    7.jpg
    # i0 q. Q: W8 CNemenyi检验常用值 8.jpg
    * o0 {& J2 D  v; C6 g' h: e' h, P2 \% c8 K7 k2 \
    9 i: S1 l! U' ^$ F" Q
    ————————————————1 t. K9 ?6 A8 i* k4 O
    版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。7 k. J+ J5 M7 b  D
    原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333) P0 h8 C/ J5 y) l: E
    6 s9 |/ O, k8 k

    8 f% m; C) r6 d9 R) i
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-7-6 16:52 , Processed in 0.558164 second(s), 53 queries .

    回顶部