QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 5486|回复: 0
打印 上一主题 下一主题

使用统计假设检验验证

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2020-5-4 15:18 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    使用统计假设检验验证
    3 S! W& A* y1 D# o文章目录, A3 Y4 t! j' e9 ]+ ]- c
    , E! N+ C* H  J" G
    常规检验( P, k' ^; |$ P$ ^4 |
    二项检验- Q8 p4 X* `+ o6 z1 C. y! U8 K
    t检验; e; w9 G$ P6 q' u3 ?+ U
    一个数据集比较两个算法的检验' b, P3 s- j+ Q  d8 J
    交叉t检验
    . s, x& N# c- v+ u) E! FMcNemar检验
    1 U$ v( g% S" I6 o  g一个数据集比较多个算法的检验  p% T, G4 w9 v% \2 H$ P
    Friedman检验
    3 i3 I5 E) U+ o# p. z( u0 ^Friedman检验图% @/ V$ ~; G6 a5 J2 ?
    F检验常用临界值
    9 @6 d: J, g- |7 qNemenyi检验常用值
    ; j: I7 \4 v5 K: q闲得慌
    ! B. x. c: H; `( e6 d- D统计学是以小样本来估计总体。& r0 u5 M& ?$ c) I1 N0 _& p4 X
    9 C9 @4 Z. F6 ~# R9 i5 m9 t! j
    在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。
    2 w4 m, w5 {. j# r5 L! L7 s# T& v9 r: k5 d. \
    常规检验
    $ X* y  ]( d/ d! }% x
    & f2 L( z% U! z1 ^# B二项检验
    ! ^6 o8 B5 d. M7 Y" N" H( Y/ E. K3 s/ S. G
    假设检验步骤及二项分布的介绍
    " g8 T2 x1 g7 p* o+ c; z% L 1.jpg
    0 d* Q7 n: q" [4 N* v
    - ]/ z$ C. Y; f1 l  ?9 O
    , ?- M* {( g# S! s  p$ Q8 lt检验
    & M0 T6 b) Q$ f+ A& n( H. @- R* B9 G' _
    多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。$ Y6 E0 R- X9 m" M% L
    t检验可分为单总体检验和双总体检验,以及配对样本检验。
    3 H, N2 Q5 M7 @+ V* F三种T检验的详细区分。
    2 V7 v6 b2 ?) y, v9 W. n, k# d- jt-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。6 X/ n8 k& j% y; G5 k1 l

    0 h( J) |0 h! [* `8 P一个数据集比较两个算法的检验
    ) Q, v7 v3 p7 g  K8 i. e( `7 l( F* ~' W" r/ ^1 n
    交叉t检验
    ; K3 H. g; ^- R9 q$ x  q: o+ s7 [$ E, R1 C
    交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。0 b: k7 s' S# J0 @0 O8 b8 H' A
    基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。8 Z" y: ~; Q' q" A3 L$ ?% k; R
    假设:学习器性能相同。
    $ M2 c. J. H) C; Y1 m6 x 3.jpg + U) a' G  c/ z0 s0 G
    1 O* `. L1 C$ L% S$ a) K+ Z

    8 u5 Q! ]7 a& p. C2 M. F& xMcNemar检验
    5 T: p- ^+ l+ q8 a9 U) E) K4 D6 K3 u1 O4 M7 G; x9 Z
    卡方分布的解释。
    # ?& z/ A0 Q# V+ vMcNema检验是一种列联表的同质性检验。0 A* n8 \# D! i. `

    , ^! L" \4 U! [! M 4.jpg
    - _: Z3 t/ P$ J
    1 F$ V  d& A( `7 Z" Z4 a+ |$ H一个数据集比较多个算法的检验& z) n, J6 A5 d/ f9 ]0 |
    / }: D  s# w/ c8 z, h# S
    两种思路:
    " g: e+ g0 N6 k+ B" v3 D# ~% A+ y" g  C2 D0 F
    算法使用上述方法进行两两比较,直至产生结果。
    / M" n6 _- v2 j( o# w1 I对算法结果进行排序,如Friedman检验。/ y! S% e. \4 {
    Friedman检验' L, }& t! t: s7 J

    , Y  [7 ~' r0 U先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。) M: R) y$ N/ z- `$ N

      b6 h$ @( q% {$ X& h+ V" P; G 5.jpg 0 I- _; g' D0 y; u- e9 ~' C
    % r% H3 ^6 E4 m/ _9 ]2 D
    Friedman检验图 6.jpg
    8 n2 o& C, w. z$ ]$ r
    3 m3 w# s+ o- E0 F5 d$ JF检验常用临界值6 ?8 D2 v# i3 V. K* o
    7.jpg
    4 G% b% N1 b* ^3 v' ?( q8 |Nemenyi检验常用值 8.jpg
    ( _: q, p5 A* |7 h/ a
    ' O- [0 ]& c8 \: L+ D1 b9 u* G  N& p# ?
    ————————————————. ]; f6 W2 L9 f1 Z0 V. R% N
    版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。9 Y# ?, x/ x( x1 a
    原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
    + _0 O9 a" X' D3 k& T$ k) v) k- q' j& Y  w$ z5 p
    0 C! p  X0 f) W3 l% C. Q" _6 W
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-2 22:37 , Processed in 0.393831 second(s), 54 queries .

    回顶部