QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4776|回复: 0
打印 上一主题 下一主题

使用统计假设检验验证

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2020-5-4 15:18 |只看该作者 |正序浏览
    |招呼Ta 关注Ta
    使用统计假设检验验证% v2 b: Q  E, [2 v1 x
    文章目录
    " B. Y; c% y2 b! j8 K+ h! g* n% j; U  @1 e' p4 u
    常规检验4 Y" X8 w! e0 l" f7 s
    二项检验
    ' s" d  N; f4 }; ?7 Pt检验7 x6 r7 d/ }7 w0 ^. O; L- d/ X
    一个数据集比较两个算法的检验
    + W$ j7 b# z" E  C2 N5 v% F+ @交叉t检验
    + t+ A# k  I/ q! V! R2 UMcNemar检验
    ( C9 U& F# D4 p% L一个数据集比较多个算法的检验' X8 Y, p( u9 B5 q3 Q, h* ?
    Friedman检验/ i4 i  m; x5 R0 t" T
    Friedman检验图
    2 n1 h0 \# d3 O" e1 YF检验常用临界值$ A/ g3 L9 W% @$ x% o+ V
    Nemenyi检验常用值
    ' ?- Q. F9 O1 k# T- [( s0 r闲得慌/ S$ O' i/ K, W* C# I
    统计学是以小样本来估计总体。7 h, J3 O% s# A! e4 C  ~% L
    3 D2 e) B3 O% M/ G2 M7 V) R
    在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。
    1 s5 t6 {' Z/ B6 \) G$ F
    ( f9 b5 _  E2 k% r* {常规检验
    ' t' C' z- j8 s) V# x- c. E8 ]& |2 [: I# i+ o% t# ?5 B: K
    二项检验$ {3 r* y% y% S
    8 U* E9 M, m$ S/ @3 l( \  Q7 k( C
    假设检验步骤及二项分布的介绍0 I, \8 _$ j( ^) R$ Z
    1.jpg
    ! c, x) O8 z  b+ j5 o3 ^" z8 G, Y7 U" t' y7 K

    3 M( N9 j) n  Tt检验1 c: t+ i, z6 \9 ^

    6 C  i# S( X- P多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。
    5 Y! J( z* |& B0 Q/ d$ ^+ dt检验可分为单总体检验和双总体检验,以及配对样本检验。) @% t& \/ C# K: T* p; b
    三种T检验的详细区分。( H3 C0 v$ P8 Y- z5 c( a, G
    t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。& p+ [5 k. ]+ R: H3 i; q/ D
    1 q; Q. q6 }# ?( z+ g8 ]
    一个数据集比较两个算法的检验
    : w* M7 F% B( B7 e: ?# j1 O
    ) j  r- I  o8 H5 T' r" Z交叉t检验
    ! K0 V& |& q3 c; C! ]4 ]" h* W+ @9 O
    交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。; R; |; l3 W5 J6 o- {/ _( I0 E
    基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。3 w; r" n; n  K1 z9 A& D) h6 s
    假设:学习器性能相同。
    5 x# X: H* z7 G; q: N8 y 3.jpg 0 x- X  B+ ^- l& G/ b2 ?
    ; T. }* \% ~, Q
    4 Z- d: M0 q. H6 Q1 y
    McNemar检验# c% X& w1 A% d  u/ S
    8 B* O* G* y& I# ]% Q4 }
    卡方分布的解释。
    * }% m  ^; u. x6 gMcNema检验是一种列联表的同质性检验。/ ^5 h# D# U; t5 f
      p/ s1 ]! C% X
    4.jpg 4 A* \) g% K9 p& z

    4 ^0 a. w6 I* e一个数据集比较多个算法的检验/ X: X& c7 `! f9 {% [7 o8 M' p
    2 L, Z4 V& J, Q( P: t
    两种思路:
    4 Q5 U1 G! g! I. Q- W. y; Z
    & _# c) ^5 k$ x' E) q& @算法使用上述方法进行两两比较,直至产生结果。
    . `* k. g1 t7 w# X2 `+ s对算法结果进行排序,如Friedman检验。
    9 m- f5 q& O/ N) O2 N% eFriedman检验  ]9 R4 Y% l1 }4 M$ H

    $ C% _" Q' u$ s# y' Y" N* ^6 V先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。" o/ m4 S8 I7 R" F, I4 d

    4 A, \& d1 c+ S7 X 5.jpg 0 D" r6 p, u" u% \+ M
    1 X& s3 R$ Y* w" T* X- }, p
    Friedman检验图 6.jpg
    - f4 Q4 U! n! p4 _* N, ]8 i
    : P/ O& r! O: }- N6 m3 zF检验常用临界值+ K3 P) r; H1 h$ y0 t/ o/ }) a
    7.jpg . n5 f$ F. h& [: z& O/ |
    Nemenyi检验常用值 8.jpg 5 q. P- F- h0 v$ y, X

    ; l6 ?/ J, E, d& ]" o
    3 _, I0 R: ~; Y2 H- a7 o————————————————
    7 z9 `2 c/ \$ E5 c版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    4 Q2 D/ h+ L! p原文链接:https://blog.csdn.net/qq_35182128/article/details/1058863333 N6 s" O+ e1 ]& c

    9 h- g& q) `! |( a" X6 K; k- u0 m) ^" p, G( h' z4 e9 w# a
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-8-29 17:07 , Processed in 0.383183 second(s), 55 queries .

    回顶部