QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 5491|回复: 0
打印 上一主题 下一主题

使用统计假设检验验证

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2020-5-4 15:18 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    使用统计假设检验验证
    6 S: z+ Y9 a& j$ Q) L; e0 j文章目录
    8 ^/ u8 ]6 w( v& f" N
    : A; J) D0 ?* `9 H: h3 j# E常规检验
    3 T) y$ ^0 O1 c" P" @二项检验
    7 W7 S+ @* c4 ?2 J1 ^% K$ d. s9 E$ qt检验8 M2 a1 n$ l& W1 m0 }$ Z3 S
    一个数据集比较两个算法的检验/ L+ w& l$ H# o, N7 x  n3 b& \' k
    交叉t检验
    % x4 G3 `. u/ k, E- I2 SMcNemar检验
    , a) W, o9 w% l+ x4 @, a一个数据集比较多个算法的检验5 @% ~$ i  }+ P7 T" K- a* |9 t
    Friedman检验9 k: }* K' w  B) T
    Friedman检验图( y: z; G! O3 J; ]9 t: N+ F) y8 @
    F检验常用临界值
    7 p# W0 i# O* B. o2 wNemenyi检验常用值
    $ f' {  s* ^- N闲得慌
    " K7 h# D9 B# `  B4 T, ^统计学是以小样本来估计总体。
    ; k- V! J8 i; T" {. @+ ~, F
    " l& ~1 n% L9 O在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。' @) e! i2 e, I5 Z+ R

    + y: q) O; X4 {常规检验
    ( L6 B; _9 ^3 @: [7 C' z5 [  ~3 ?! B9 N3 n/ k! G
    二项检验: R( |" s. l& A2 o* E* ?" g* Z* Y

    6 a& ]/ F3 E8 a& [& _# z# m假设检验步骤及二项分布的介绍" \4 ~7 B! i9 j1 r
    1.jpg 0 E0 G% x3 r  A* `
    - K8 o4 S( f0 ~" R
    3 o! L9 Q/ o( T4 s9 W# W
    t检验
    ! O" K3 e! f3 L0 t% o. i1 R: h2 `9 p+ ^9 K' f6 [6 j
    多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。+ [/ o/ Q3 Y) D: N3 F% r
    t检验可分为单总体检验和双总体检验,以及配对样本检验。
    + ~1 j/ I3 X: e' c三种T检验的详细区分。
    ' t+ @: N4 U  J4 p1 d$ {t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
    ( Z4 P# w; F: U/ U  S! W2 }9 ?! d. G7 b! q( Y, ]
    一个数据集比较两个算法的检验8 U- `7 W( J( W4 ^! J* Z0 m
    : H0 G$ d, I% b$ t3 w
    交叉t检验% z. H) K+ T* u5 b8 F, u& t
    8 U/ Q. e2 F  }; r
    交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。5 C& \) d! y* b5 d' \( j+ F+ \
    基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。! h9 T8 K$ z8 Y# a& C9 Z
    假设:学习器性能相同。" p- Y. R0 Q  R' N8 {6 p
    3.jpg 3 N/ ]" |$ Y, A' ^

    * |0 b" I& d6 V! e+ C/ j, ~% Q, g6 `& p' A- n
    McNemar检验0 w( q, W6 f( m6 w# ^/ q2 N7 Z
    " @7 [# ?& L. Q, G# R- G& k
    卡方分布的解释。
    - P# l$ [6 z- ?0 Y+ V* JMcNema检验是一种列联表的同质性检验。* q; y# ~9 @* k1 h/ b% @9 M
    8 ^. D1 Q# W) l. @5 u- u/ J# [5 A
    4.jpg + g) I& ^; j" H% E: Y6 M+ t5 F' B

    - \/ `; `# B0 [3 b! q" j- T3 M* q一个数据集比较多个算法的检验, K+ x+ K( w$ g6 u  t! k

    3 l1 c' z1 b+ ?- s( o两种思路:
    / @! A. V0 X9 U
    4 f5 M9 E, W/ H0 B* j算法使用上述方法进行两两比较,直至产生结果。
    $ f- K# r% w5 `对算法结果进行排序,如Friedman检验。
    * P" ?. b; m3 b  F# T: b& YFriedman检验; X! x( n/ _+ x7 y! ]( M) y
    / o/ y4 ]! X' O8 {; @2 a
    先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。' v  J9 I4 c0 @2 |6 N$ n* B

    1 h* R% E9 a; ~! }1 \3 c; ~' ~# K 5.jpg
    7 I% k  M# j; J' P  b6 v- k5 e3 C3 I0 t5 `
    Friedman检验图 6.jpg
    + X; J- h- L: G
    % ^; |6 `& k6 b7 d0 g* Z8 KF检验常用临界值; k/ t' A; p) P8 N9 f( _
    7.jpg
    & P; M- Y! [$ w/ x% f- BNemenyi检验常用值 8.jpg
    ) e8 e9 K4 h: Y4 q" W9 i+ s1 t2 I4 P# m% r' ~2 H% d

    ) y  O8 l& o3 C3 I/ A————————————————5 m- I1 I5 w2 _+ m" c* r
    版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。& Y3 k% h6 H4 W* ~# w) J
    原文链接:https://blog.csdn.net/qq_35182128/article/details/1058863330 E: D( K! Y* e' Z* h: [
    $ V" @1 |1 ~5 l4 c! _

      q( @, A$ e" E; R
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-3 12:20 , Processed in 0.452622 second(s), 53 queries .

    回顶部