QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 5453|回复: 0
打印 上一主题 下一主题

使用统计假设检验验证

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2020-5-4 15:18 |只看该作者 |正序浏览
    |招呼Ta 关注Ta
    使用统计假设检验验证4 I1 p& D  O6 }# s" F; V
    文章目录
    * u- J, Z9 K! E# j8 P& N0 B4 k8 \' j9 i4 u
    常规检验7 b; R% M8 v) F' M
    二项检验
    8 f8 c; U6 k) z+ \; T4 G2 }% St检验
    ) `& \+ r/ x8 \$ o一个数据集比较两个算法的检验& d; {  o: ~2 }
    交叉t检验
    " e; ]) B6 a: _' w! hMcNemar检验
    & L% Q2 w4 p1 r3 U, c3 H* ~一个数据集比较多个算法的检验
    ; A1 p1 j2 g* ?! LFriedman检验
    1 u! t" K( C8 T4 Q7 @" U4 w+ eFriedman检验图7 _6 ?& ^- N  C9 L* q! |5 `; C$ O' @
    F检验常用临界值0 ?1 l: e( t7 _6 x- O
    Nemenyi检验常用值
    " C  x6 |+ ~0 K, R0 ~  n3 M* F闲得慌- P9 c0 O2 j% o
    统计学是以小样本来估计总体。
    2 x* A/ I) S$ c2 V$ M: u7 ^3 _1 D7 n) n: ~
    在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。0 h1 w. z6 A& w8 {' c" b& [( X
    ' _: \2 ~9 w0 n/ @$ N$ u% V. {
    常规检验# `2 n! d, M5 L# ^% Q
    & ?! M+ T/ e* |9 @& k% a. n
    二项检验
    * n: \/ L3 d7 Q: Q
    % ?' x% a! M5 t1 b1 v% u8 j+ T3 x假设检验步骤及二项分布的介绍
    0 o% v; J% d0 P7 M 1.jpg
    0 y  G8 e# A5 C4 l' i" B9 l5 q% b! O+ z, A- h
    / G( g. d; {8 T$ L2 O
    t检验
    ) U/ T5 k. X& c3 k- n
    % S* H, o* q' d+ k( w多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。" B- ]3 t! e# ~. m' ]. X, A8 R
    t检验可分为单总体检验和双总体检验,以及配对样本检验。1 S6 v' `' J: c) \0 o7 o( k( W
    三种T检验的详细区分。
    ) I; m3 |! T5 u; j, X. _" {7 ~t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。/ L; A2 M( A6 A

    $ \2 L2 e5 {# T, B9 i# Q一个数据集比较两个算法的检验! N5 o4 {# y) W

    5 P6 W3 v1 X& v交叉t检验$ |! o4 g3 X5 i$ K" r* }4 f9 T
    4 j& R% }6 ^6 R4 T+ e) Y$ X; g
    交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。, @8 B- @' x) \; H7 S# h
    基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。/ s3 M9 G' [" t2 ?/ q' S
    假设:学习器性能相同。1 ?1 E# ?1 j) T- B0 p3 `
    3.jpg
      g2 Q8 D9 B8 {8 D' V5 \
    , C2 M1 ]8 ~3 l1 s. ^8 ^9 ?: \( L; C  h' p0 F) r- f8 R, [0 v& G$ V
    McNemar检验
    * k2 t: Q& ]+ F4 V
    : `2 u9 O- e" @3 ^0 y. @卡方分布的解释。4 v$ m' R) ^9 R* u
    McNema检验是一种列联表的同质性检验。$ ]0 V' {% V" X; `8 R  E1 u$ |# [
    - n. H, O# B/ V$ H9 j9 [4 }$ D
    4.jpg 1 d) C2 D4 F6 N4 O( a3 e
    1 g' R9 f5 I3 s* u& v3 P
    一个数据集比较多个算法的检验0 K+ P6 Y* o$ }% S/ K6 O2 I: z  i0 w

    1 ~4 r% Y4 |, z! \, ^9 X两种思路:
    # p3 F2 n1 d- y4 Q5 C- T
    4 d$ V/ d. g/ P3 `; @/ \算法使用上述方法进行两两比较,直至产生结果。
    ) _: U4 ]1 _2 K4 D& D8 d7 N# m6 v, b对算法结果进行排序,如Friedman检验。& }8 Q1 }3 @' x: g$ _1 S
    Friedman检验4 r3 y3 |" ^0 n9 V4 W0 t

    ) Z, m9 @  M9 b! C% S先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。7 f" N* L3 H& n9 p( h

    ; W5 M1 c9 R# O 5.jpg
    8 w6 c6 N8 x  M- S- t6 w# I# \
    5 j6 Z8 P  [( I1 G. J$ @Friedman检验图 6.jpg
    . f+ A/ e4 a! k- e7 f9 A+ {6 Z' F& |2 z- X5 }, |
    F检验常用临界值0 s  I' O8 m! V  ~' e2 Y
    7.jpg / s. Y8 H+ `9 G5 S/ ?& L" [
    Nemenyi检验常用值 8.jpg
    # W3 J& ~# @# N6 Q  }% z. ]. @" k, ~/ o! O- l: ^+ N7 f# t; U
    7 |: p; p1 ?' d' ^( J) J' }
    ————————————————* |- m3 q- ~6 [# e  o" ?; a3 h
    版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    ) E% e* q/ ~4 e1 `; t原文链接:https://blog.csdn.net/qq_35182128/article/details/1058863334 q# X% ^7 j) y& U4 ^& G/ a% S# O

    ; o5 d* U) R7 [% q& T7 m6 g
    1 ]. U6 M8 A; ~8 d6 c
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-18 20:24 , Processed in 0.419742 second(s), 59 queries .

    回顶部