QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 5454|回复: 0
打印 上一主题 下一主题

使用统计假设检验验证

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2020-5-4 15:18 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    使用统计假设检验验证
    , r! B- v# B8 \4 n4 [文章目录& w# T9 ^  v$ l- Q& k
    3 o- B$ O, r' {
    常规检验" y& q2 X  A' f% c! Z4 F% q
    二项检验
    # M6 [- b& @* q* ]3 t% T0 Pt检验
    # o9 h. }0 V9 d5 `一个数据集比较两个算法的检验, F6 j/ z" O, q
    交叉t检验
    # w" T3 |: z. [0 N. ?) P5 `McNemar检验/ ~8 D- w- e: T( K  ?  O4 x
    一个数据集比较多个算法的检验
    , e" Q" D( \' Y% W; G# K9 a; k) ]Friedman检验$ q; ]" ]% d: g+ Y* f0 W
    Friedman检验图
    ) h: w  N9 {9 H! n* ^F检验常用临界值& e% D$ K0 @) T7 G
    Nemenyi检验常用值
    9 r7 x! Z2 ^  Z闲得慌! Y% y. V. f1 f; Q+ ]
    统计学是以小样本来估计总体。2 u& f  G0 h. Y- n3 D( r  z

    . ^  X# u! e0 C  B在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。, m. d, d5 c6 c5 E( J9 o1 ?# Q& A$ J

    1 L4 \! u3 I- G$ ]+ Q/ F常规检验
    9 P8 {' A* R' Z& C4 J* H# T- ^8 \" u& q) \9 ?
    二项检验4 B6 f+ O) j' [
    + S5 f- U* v: i/ Q+ o; T- v
    假设检验步骤及二项分布的介绍
    % }) u: K+ s, V% w7 A! @9 \ 1.jpg
    9 J1 p* U( @# `. |! s! `! _
    " o( \. k' _6 ]( B4 L1 f1 T6 R6 e! _# f7 b1 y
    t检验
    9 U7 e+ I' G3 b# j& B1 b" M6 r( R6 J  H) M# W* D* k% k
    多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。
    ! \& l/ V4 X! ]5 ]5 T. ^$ Zt检验可分为单总体检验和双总体检验,以及配对样本检验。
    ; y6 `$ F! A* W2 H7 w/ @三种T检验的详细区分。6 `  I; Z# u4 x; r# l4 Y' D
    t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
    : H( V1 X) ?) v% _; I. q! ~) f1 b. B; O8 t" \) u# B& k- i
    一个数据集比较两个算法的检验
    4 J. D' m2 L8 v8 ~: n7 J0 y2 c9 U# K% ^; e5 A9 d
    交叉t检验
    ' |. c3 U( }" C$ k
    ( ?! t6 Y& A4 h% ]  x+ P3 l- N交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。+ {4 N  p: X4 e. W+ f3 F
    基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。, `: U. `7 ]6 w  g1 }+ r
    假设:学习器性能相同。' }9 B: m% y; J* w) f* {
    3.jpg
    $ k& L2 b. u/ s7 L0 d* I9 w0 Q. ~- L2 v% P% H
    ; v) O+ o) r7 K$ m, T
    McNemar检验
    * @4 ^. p+ H3 }. @# u$ U: K
    0 r! f2 y5 S/ O3 U3 L" x; @3 t( M卡方分布的解释。
    ' s: M" T. ?) W1 v/ @  ^McNema检验是一种列联表的同质性检验。
    - v1 e7 B/ f$ o3 A! n+ @; m/ H& v2 g! j# s3 r4 D0 y
    4.jpg 9 q. {0 ]* x) k: W/ w* v
    0 E0 w5 s: b# k3 V( @* z
    一个数据集比较多个算法的检验/ k% x' H  X) D! X
    ; g4 u- u* x1 ~( R4 \5 c; F1 W
    两种思路:
    " l; r0 x( \+ ]7 G4 E# j4 }
    9 _! U; J% j, z) U# [算法使用上述方法进行两两比较,直至产生结果。8 S+ [6 U2 ?! X; H+ Z' {# Z
    对算法结果进行排序,如Friedman检验。8 F; b6 M2 f4 }  J* Q! s! F
    Friedman检验! G! O) }" G  V

    6 r* m6 Y. S5 s/ ]3 ]先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。. G+ q: j, ?* [  I+ P( x0 \: h- \/ _  @
    ' b/ r, h' _: M& D: I4 }: G& x2 G7 p
    5.jpg
    ( F5 S9 ?3 I( D: p+ V
    " W* |$ Q& V3 i% ]/ O$ uFriedman检验图 6.jpg - \' l# o* ?% P

    . n7 J8 F0 }* t$ L- `: h. iF检验常用临界值
    8 c; [  B% B: u0 {! p) }4 e: V 7.jpg
    ) {4 {" }( y* Y: [( g& ~9 ^Nemenyi检验常用值 8.jpg
    ' l% m. v# Z% @# @
    ) i4 [0 h& W$ t- `6 L  S
    / @6 H2 \! Y. ?( {5 p% X9 g————————————————
    1 P. G7 V8 p8 R' Y+ c' n) t6 @版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    / k/ I. V. m" A  a) J; S- v7 p原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
    - K$ _6 S; e& w5 E( l7 |* l
    . L3 u/ |8 k/ A* O  f4 k+ g7 a" }# _. ]. o* K( |" `' X5 M$ e
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-18 21:58 , Processed in 0.384483 second(s), 53 queries .

    回顶部