QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 5455|回复: 0
打印 上一主题 下一主题

使用统计假设检验验证

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2020-5-4 15:18 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    使用统计假设检验验证
    2 q$ R8 Z+ h/ w2 J# j文章目录7 h( u: _+ o  H, b5 z8 d

    3 T. ^0 }* Y+ d常规检验
    3 \8 r1 |' @8 Z+ b- @( L# ^2 U* i二项检验4 e) p; e/ C# {4 y/ W7 _
    t检验
    8 a( i  r, q+ T9 e4 I' I一个数据集比较两个算法的检验
    + i) a9 `7 \1 q) S8 J) O! j交叉t检验
    * s# m  U" I$ y% \3 `McNemar检验
    . j9 l$ g" `. c) ~, Y% f/ F- g; H一个数据集比较多个算法的检验
    $ J. H! m; X" `( D# z8 U, dFriedman检验
    5 J1 ]% N/ n1 b/ |& H  \8 M/ WFriedman检验图3 R$ m: O, T5 K. A) K8 f6 a4 [8 h
    F检验常用临界值  P5 ~/ Q8 m+ v+ _4 }4 O- S6 y
    Nemenyi检验常用值
    5 P1 J# N- L) v+ h闲得慌
    : C  t, P  J- O; Q6 P统计学是以小样本来估计总体。
      }$ ^# I2 T/ Z3 L8 B3 W+ R' f# F/ J0 ]2 n. r
    在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。8 p3 I, b* z9 f0 \
    ) h% f# {2 y- k
    常规检验
    4 s6 g2 }! Y6 V/ {2 k" {# ?% [# [7 e
    二项检验
    * m/ u& n9 o( d! @
    . K: S  M' A; K  d; K* p假设检验步骤及二项分布的介绍
    5 k8 H2 k1 c: W& ? 1.jpg . O5 C7 g" I3 @2 u

    7 B4 P" x5 q' S+ T) T3 H& H$ O& B- e; P3 Y) }; R6 y, L0 k
    t检验
    9 h/ ?9 S2 z$ h6 l
    . o5 J% Z' t7 T+ _7 @多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。
    4 m9 {- L% x0 X8 m2 ot检验可分为单总体检验和双总体检验,以及配对样本检验。
    2 G/ R4 [/ N0 v1 s三种T检验的详细区分。
    ; j5 I+ d, Q5 dt-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
    ; B$ P0 ~2 S8 m0 w) p9 M' R$ W
    ; [) `% J+ ~* e3 U一个数据集比较两个算法的检验
    / D. ]1 |# M* g& M# h4 l0 x/ j6 U$ y( p3 f$ ^* J- t
    交叉t检验- C* |( R( H0 q: g

    8 O1 F, B- z: N5 i交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。+ ^+ V4 F1 B' Q. o
    基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。1 v, \& h8 f4 O+ J5 P7 Q
    假设:学习器性能相同。, r, _/ c9 ?- c: ], j' D
    3.jpg 0 ?7 G8 z& `" p4 _+ B
    / n! z2 {% x3 E% M! }
    1 `/ }3 a* k+ [$ u9 `1 E
    McNemar检验
    9 ?) f7 W* W' U9 z$ u* `2 ~
    & K' l) N5 \; I0 N5 \: r5 k卡方分布的解释。! Z) |" t2 L' ]$ _
    McNema检验是一种列联表的同质性检验。( t; _1 m3 Y# y
    ! v' e4 w1 X0 M8 @
    4.jpg
    5 G* `' k7 @+ x! d& g0 q( j* ]9 q) D! g: n- D8 r  F* x
    一个数据集比较多个算法的检验, Y5 ?3 c  G0 `' }2 ?
    ; P4 ]4 {0 Y1 T' e; q( H: D; _5 ^: Y
    两种思路:
    3 z& b- E7 L4 p2 q; k+ O3 N  A" }1 A( ?( S
    算法使用上述方法进行两两比较,直至产生结果。- }0 ~' O/ W' [) P4 m
    对算法结果进行排序,如Friedman检验。1 B2 M" x8 e) ]- |8 Y. u, N0 B
    Friedman检验
    . d) G! L4 m1 s6 W
    * S1 ]5 f3 z6 y* ?1 l, a: z. U先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。* A9 m$ P, E/ p' x! j9 r" H( \

    . L5 g  b  c0 p# I  q. @* w 5.jpg
    . V$ T* h1 z6 F' o
    5 {0 D0 l! D7 j0 R4 xFriedman检验图 6.jpg
    ( w( B1 K4 B! ~: j5 {3 W$ n
    $ q' |2 F: ^, |5 Z& y5 ?; EF检验常用临界值  {6 m# F6 Y; w( V! {: j& x
    7.jpg ( N7 q' {0 Y; e- Q& ~9 N! w
    Nemenyi检验常用值 8.jpg : _8 ?+ T. P& t) f6 A
    + P( c) |. P' M

    1 U2 H, O& ]. L5 o————————————————
    ) ~, m; B1 d6 K# {3 {版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    $ ~* B( X4 j: l原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
    ( L% @; U7 o+ Y0 R6 ~) ~
    6 Q3 Z4 o+ D- K9 i  i) D7 q7 s) k5 \/ X$ S
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-20 16:57 , Processed in 0.428286 second(s), 54 queries .

    回顶部