QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 5449|回复: 0
打印 上一主题 下一主题

使用统计假设检验验证

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2020-5-4 15:18 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    使用统计假设检验验证7 E% J( @' @, }& A) ]
    文章目录
    + S  N% P5 t" J9 b( `1 Q6 b2 w& r& _+ Z2 J+ ?
    常规检验
      u: y+ O5 c9 T9 @- f4 X二项检验
    0 J+ g, C1 [2 e. \6 r0 N; [  Kt检验! {( l  J2 g( \5 B* ^! u; w! j
    一个数据集比较两个算法的检验; k: }9 `+ q2 }' [8 z# I% \. m
    交叉t检验
    8 z/ x7 @9 K; G( j+ i, O6 qMcNemar检验
    1 B: T; s5 h' w) w% V1 c' Q一个数据集比较多个算法的检验
    8 l' b, E3 Y) r1 R& yFriedman检验
    4 X- D& s; ^& v% c3 T3 V5 V' ^Friedman检验图# H' K/ ]4 j. x" X; Q- h
    F检验常用临界值, _  T) \/ m; e! x6 v
    Nemenyi检验常用值
    9 |, H" h! f7 w6 X8 }& M7 n闲得慌8 @6 q  m$ U) S4 Q! g- A
    统计学是以小样本来估计总体。8 F4 V1 `; }( A' t" n5 U
    : I, _" Q6 G1 J. Y0 i) K
    在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。
    0 @6 H: y. e1 F% K* u0 I$ w, z
    4 t) t9 v, g3 c% G常规检验
    ) r$ H/ r) D. Y# g5 d+ U( T: w1 Q+ T* ~3 L% a1 ]
    二项检验
    2 _6 T$ L& D9 e) _0 |# C$ L. c6 F# g" }5 f% K$ Z
    假设检验步骤及二项分布的介绍
    ) w* e& N& s  Y! S 1.jpg
    & y6 o% |- ]; W) e+ n, p5 o# }4 d2 s2 u; Z# ]

    6 B+ E/ F5 O6 O4 Kt检验6 {! z: c% T7 c7 ]4 B# v8 f

    4 b1 E/ B2 `1 ^! m9 _多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。
    ; l! r: L3 k# B1 d( Y4 m0 zt检验可分为单总体检验和双总体检验,以及配对样本检验。& x6 c' J7 o) k7 _  u( O
    三种T检验的详细区分。( c# w4 h* C# h; t
    t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
    5 M5 Y7 ]) _$ k( `2 k. k5 F+ x2 W( |8 ?8 P+ ~/ ]! `! K8 [9 q( l
    一个数据集比较两个算法的检验
    ! ~# D9 }# \4 V
    " C  a. V7 H, R交叉t检验
    : V' T2 S" |  n: N/ E* i$ @. u
    ' N1 c& }- ]  ]" F: s交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。1 U7 v8 I* Z  o
    基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。
    " I! p) u7 W! ]) I5 ]" e: X假设:学习器性能相同。
    ! _. h2 f4 ^( C2 s/ ] 3.jpg
    ; {0 t5 e2 c. @6 @' m8 G4 H9 b0 b1 R# R: K. s# R6 {; u& ~- ^6 {0 H+ X

    7 L: |, |" r9 t+ @. yMcNemar检验- y  o; y9 \1 X& r4 q
    ' a. z. V; |& Q6 j4 |
    卡方分布的解释。" J" g- u3 o$ ^) q  u
    McNema检验是一种列联表的同质性检验。+ Z/ X- L# R! q$ ~" j( Q

    / a9 [+ ]5 g* U' O 4.jpg ) v  p3 `1 J1 d# ~% N6 F

    + b/ f$ k9 ~) v3 |% {' G! h一个数据集比较多个算法的检验
    4 o9 P3 h8 `* ^. }6 _2 T* ?
    ! c3 m% K: ~% V% `3 s两种思路:
    & l- R( S8 Y/ c8 B) k2 ?) A6 Q9 _5 Z! ?
    算法使用上述方法进行两两比较,直至产生结果。
    ; I" K5 C8 U+ e" a  n" C7 P对算法结果进行排序,如Friedman检验。
    # f5 z* z' Y+ rFriedman检验
    # g2 E1 d% E- m4 H: q# O& I9 s# F4 Z5 s* ]4 m
    先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。
    ' f8 H  B1 }+ c/ Y+ z
    3 X4 O9 g/ N- G3 \& d3 V 5.jpg
    ! `  B" Z" ^8 m+ K2 |1 w- o$ u  }: O2 ^# e  u9 `
    Friedman检验图 6.jpg 9 K- \; W& y/ c' e# N

    % ?- R0 t$ d; i$ yF检验常用临界值
    5 ]# A( S3 X1 g$ N4 f 7.jpg 8 `5 h* Z! ?. q, o
    Nemenyi检验常用值 8.jpg 1 b4 {6 j8 z6 s6 J+ i' u* Y
    / q' ^/ ]; G1 l( [1 Y& z0 l5 {
    $ `! Q( s: I  S2 ]/ ~) q, R
    ————————————————
    ' |3 n( k" ]* N: t版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    & \, |1 o3 v% m1 j& g' N  j% @; H8 u原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
    ! r4 \' ?" x0 o0 p, ~+ ^, |7 a9 e$ J% b2 W7 A' }0 D

    ( o! T6 W, N5 Y9 O3 t: Q
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-18 07:06 , Processed in 0.491352 second(s), 54 queries .

    回顶部