QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4815|回复: 0
打印 上一主题 下一主题

使用统计假设检验验证

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2020-5-4 15:18 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    使用统计假设检验验证+ p' C- p7 B2 D& k( }, w" ^  m
    文章目录* P" P. d' I7 d" D8 `7 u# j9 S% @
    ( `$ `" ?4 Y+ o6 O$ r
    常规检验
    + p5 \3 j1 J  r0 y% T- l: y二项检验
    8 l0 M6 Z/ \, M5 p& Yt检验
      C) T* ]- r# f一个数据集比较两个算法的检验$ F* w# e# z* z* `7 Q0 s1 A
    交叉t检验2 D8 Y+ v/ e# d$ U0 [
    McNemar检验2 \0 \0 I9 r/ E
    一个数据集比较多个算法的检验( C5 f7 ~. a2 p/ J0 g
    Friedman检验
    ) N( B  I( e) \8 K: ?Friedman检验图
    . X7 {7 [* `& L/ UF检验常用临界值
    3 A* w. j3 ?' k* o: m7 bNemenyi检验常用值
    # m+ x7 x, P$ _+ S闲得慌5 H- R& B( t0 K  N, k
    统计学是以小样本来估计总体。9 N& Z$ Y2 `/ ~4 U' l6 O$ K
    - q0 Z6 L1 A( P- b3 S' i
    在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。6 n- I2 J6 g. t3 w) F

    , T7 Z5 e, Z! ?; G- B. W$ @常规检验
    3 D5 H4 y  V2 s$ V* k
      j- m& y' a7 h  k9 Z二项检验
    0 j  F$ ?# F' K
    6 z1 L4 G; V; y8 U6 `3 o& X假设检验步骤及二项分布的介绍: a9 E! Z/ C% P. A( O2 \9 M
    1.jpg ( g, Z* h5 O. s! L7 o0 F1 |  @
      M: m/ L# Q6 L2 d

    7 i3 o% T- d$ M! J3 Gt检验
    * M9 l7 ^0 d* K5 X9 J3 k* T& v; \! W( q. a8 [4 `
    多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。
    / O9 S4 H9 F! q! Tt检验可分为单总体检验和双总体检验,以及配对样本检验。7 l% N1 M& f  b: O& J3 q9 }- W
    三种T检验的详细区分。
    * l1 O% [* N% Lt-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
    ( D! ~) ^. @; J: {( _& X- `; D' R& b' t( N
    一个数据集比较两个算法的检验
    ( @3 X2 C. `9 ^* A, N. |0 D. Q
    3 p! @0 |% ?9 s- D4 r交叉t检验
    4 m, N5 p6 p& w  D# ^7 [$ X+ q4 ~: N$ r+ @% [" s& a$ t
    交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。
    % Y+ R9 u( @- @: |6 r% Y基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。
    % k& ]  V$ Y- a假设:学习器性能相同。. C5 L3 W, q1 e) b: Z6 o; B
    3.jpg
    " y( A) b0 Y7 g6 g& X, j+ K- B- z0 I+ c! P& a! |% T& |
    : d5 e6 w& t. C! r$ A1 d
    McNemar检验" A& p3 \" J5 T1 t( F
    ) b9 L: N' e; W: K
    卡方分布的解释。
    ' x2 f1 f5 `, u* c4 vMcNema检验是一种列联表的同质性检验。
    - q% d: ~% I; K* W. K. Y0 H: h5 c0 q. ~; _% ~
    4.jpg
    / P" E$ f" ^' N4 X6 I
    9 ^% l, I2 u/ S4 `一个数据集比较多个算法的检验; C1 C, o& b: s$ z
    3 ?9 l7 q& l. O3 H$ b
    两种思路:9 T: I2 v( `: L& J
    * o: p& B) e# N4 T  n" f
    算法使用上述方法进行两两比较,直至产生结果。
    3 l4 b5 \' P% o" t3 L: n6 K, E& a对算法结果进行排序,如Friedman检验。
    ' D- I8 U0 x3 y. B6 m/ JFriedman检验0 b0 t7 u, \8 [9 ~: p8 D2 n" W% E
    9 X" y) \* C4 r& D( }; x
    先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。  I( F" [* d' y2 r
    3 t- q! ~7 ~6 C* V6 I! n% p
    5.jpg 5 ^2 `) H. f3 O; N" o/ D: a

    . }0 ^( a$ `' P5 M9 V! XFriedman检验图 6.jpg , g% e$ U& L/ A# p6 f! y

    & y7 H! N5 ^* |8 c7 O* \6 `F检验常用临界值
    5 c$ G8 j- W/ _4 E 7.jpg 2 L2 p1 L% C5 j3 Y, z8 Q
    Nemenyi检验常用值 8.jpg
    7 K. q1 y% n9 q3 Y" `# N$ X
    . U, S/ Y% V3 d& @
    - x0 e. }+ k1 v8 _' r1 N& |————————————————8 p" K$ w7 S+ W  D& n" O& R
    版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    / B; J5 {" O, ?4 i0 m* }原文链接:https://blog.csdn.net/qq_35182128/article/details/1058863333 g9 T+ y8 h& |4 C# N
    + ~8 M) s6 T. }( k& L& |' A+ N- Q# a
    6 o4 p' G+ k" l
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-9-8 12:32 , Processed in 1.486739 second(s), 53 queries .

    回顶部