QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 5457|回复: 0
打印 上一主题 下一主题

使用统计假设检验验证

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2020-5-4 15:18 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    使用统计假设检验验证! D" K& {; ?1 z! n3 [7 n7 `
    文章目录
    5 h! Q. f: m& c& B* G7 ?/ V. R1 o: t- C8 t# d' p1 i
    常规检验% U' p: v; Y5 G% }- J8 q
    二项检验
    1 m- v) {: `8 [1 B2 J% k' ?& t& Lt检验
    & f" S/ e+ U9 M一个数据集比较两个算法的检验" m  A3 Z( `: p- r% g
    交叉t检验( U. C0 E8 b6 K  r6 m, Q
    McNemar检验9 `+ f" l/ r  C
    一个数据集比较多个算法的检验6 h$ m$ R0 Z6 q* B$ j3 d4 a
    Friedman检验
    7 R4 \: x: G4 g' ^% U3 V# U# f9 p& yFriedman检验图" I3 a3 _) [+ m( T  U9 w  ?/ j9 v
    F检验常用临界值
    $ |# p8 }* d/ \3 M2 m- [, f. I& xNemenyi检验常用值9 b" S' y& S% r5 l
    闲得慌# B  C6 l9 n, s; M- U9 K
    统计学是以小样本来估计总体。; L. S8 d' C! b! g; o. G) H
    6 v6 o7 A7 g" F+ @# u8 @
    在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。" @# S2 ]% K" I# @

    + o2 C0 a! b2 i常规检验# l' l, X' Q# |2 A- n* D# K

    9 S9 B1 `% b; S- _7 Z5 [二项检验
    # y- c. i" Y7 |4 B. n: a/ w7 q  W7 W
    假设检验步骤及二项分布的介绍: |+ N# _7 g/ o2 C0 A
    1.jpg
    " m" _. o( @; l9 W7 _1 U
    & Z* D+ O2 X& R4 _/ a' ]
    + C1 ]  v$ T0 s* o9 l+ Vt检验- F+ p% }; f2 e3 H" h' X  m/ r

    4 h4 s) Q. }, b* @. l7 t多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。0 F% t6 E0 A! v# s
    t检验可分为单总体检验和双总体检验,以及配对样本检验。
    6 R1 h, b( Q; i' P; b9 W  y: z三种T检验的详细区分。
    9 S: G% V; G; f5 ?- Z; O4 E) ot-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
    / w3 d* Z, }2 N' S
    " x9 r/ P3 u$ D" o+ T- ^) `8 _一个数据集比较两个算法的检验1 O$ H' V. H" U; i- z
    , T& D! y, V/ v  g+ l4 F
    交叉t检验
    4 }9 N; y. r1 k! H( p# P- l5 R1 }! A' c) _
    交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。
    ' W0 B* X% ^1 l基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。
    0 y$ R+ @4 d! l) D5 K假设:学习器性能相同。
    & M7 }- X7 ?" K! c 3.jpg
      {4 O1 Q4 e  R0 A
      q7 n) w% P% @
    % L) n+ R. h8 ^) G; f1 YMcNemar检验
    % L: j0 H( d( P  N" d3 D, N) u" G) z0 X0 A* i& V* b5 J5 [5 o
    卡方分布的解释。
    : O9 F" p+ ?+ O+ E2 I) a: H. a, x1 R2 d& TMcNema检验是一种列联表的同质性检验。
    3 D% I3 t- H) |! m5 k0 P: S" B& D- C- `/ l8 Z/ n( ]5 m3 R
    4.jpg
    # G. r& N+ [% K/ e( }; p2 o% C* d9 x; \' c3 \  j/ [! u
    一个数据集比较多个算法的检验
    6 ^# d. s) u6 G- p: J# b
    - o; @: l- \% e+ I' o两种思路:5 I6 X* z' u! e. ?
    & A: w# t5 c1 ^
    算法使用上述方法进行两两比较,直至产生结果。
    8 o7 E( S  K8 F6 \& H# b+ k9 ]对算法结果进行排序,如Friedman检验。
    1 @. {( l. g7 H: iFriedman检验
    + }/ U% H! G5 X+ x4 J9 h8 N' Y8 ]+ F/ F. ?9 a% X
    先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。
      {, I) z! w" \
    1 D" r' d* q+ { 5.jpg
    ' W0 @( X' G7 v: k& z) J5 \: t0 r4 s+ q% J2 g# }
    Friedman检验图 6.jpg / j  V0 d1 B1 d8 Q- a$ m
    6 v6 ]# W7 D' m! L* V
    F检验常用临界值
    # u& a7 N% G, u, ` 7.jpg 8 @' |7 B. Y2 ?
    Nemenyi检验常用值 8.jpg   W) D6 E% f, I: ^  k

    2 o. }" {7 Y: j8 H+ x5 X7 x* z3 \" f0 }" J# l
    ————————————————
    6 s3 T5 P8 Q/ f& W8 g版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。8 W0 H! S1 O# a7 x6 d
    原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
    % C( z- `1 q$ W( s( u
    ' q2 z9 L: Y2 J/ e
    ( z6 q1 e* j1 ?- H: e& q1 s/ `# G* y
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-21 13:48 , Processed in 0.447053 second(s), 54 queries .

    回顶部