QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4500|回复: 0
打印 上一主题 下一主题

使用统计假设检验验证

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2020-5-4 15:18 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    使用统计假设检验验证8 y* g. y8 i6 u' M5 i# L$ {
    文章目录( h2 l+ u4 Y% t# I( w4 s6 H
    * b8 B( F5 e4 S, D/ ?* V* w  R% h4 J& |
    常规检验. w4 I1 x2 w8 v' ]
    二项检验
    4 u7 B$ a5 M, A/ jt检验
    3 D) e# u$ \  {5 y' R一个数据集比较两个算法的检验
    * S, i4 n2 ?; X7 ^8 A交叉t检验  }4 t6 K& U9 I. q* {' [6 }
    McNemar检验* q* y4 X7 ]4 {
    一个数据集比较多个算法的检验! z& M; O0 J# _6 @! L
    Friedman检验
      M: g& C, f; ]6 t# c2 kFriedman检验图
    ) ?3 @6 V& l) {$ Y$ \" QF检验常用临界值
    0 G0 \3 d" X; Y9 ENemenyi检验常用值: R( ]/ m! F8 o
    闲得慌) ^( p* \- T  Y7 k2 ^2 ?
    统计学是以小样本来估计总体。- O% V, B" P! o  \: }6 V( s2 i+ M

    1 }- D* I8 V7 Y: }) H0 R! z9 q在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。% p$ i) }6 {3 B$ f- g" R

    7 C8 r1 N* l  ]2 R" r常规检验* {) f7 E' U9 G* M9 w1 T8 i. ~7 |4 Q

    . Y* F- R) W! U  @* }  t二项检验
    % `  d# F/ R3 Q# R. Y
    ) Q: w  q5 s5 S" o, J5 s6 l假设检验步骤及二项分布的介绍' n5 \  i, z) Q8 G. J7 R+ B
    1.jpg ) Y0 U  {3 `. D7 t

    2 J, T, t& p) Z5 h- b2 i5 K/ P9 j! A5 _
    t检验
    8 o6 \, ?3 L9 K+ ]' d9 A( @
      M* q6 e% [+ k5 U+ q0 b多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。
    ) a3 O  J# `% d/ x. z9 jt检验可分为单总体检验和双总体检验,以及配对样本检验。
      x. a. N8 u) R6 g3 @" o三种T检验的详细区分。. ~- R) M7 c5 P2 a6 Z1 {
    t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
    & r5 h) m/ i) T$ K9 [2 S: F( }7 U8 d" e# X
    一个数据集比较两个算法的检验
    9 h) Y$ j  G1 f, N3 L. z3 k. o- D" D0 `8 u% {
    交叉t检验" G4 C& f7 M; J( N2 s
    - ~  q1 m9 u$ d
    交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。1 x( c0 ?+ U4 N9 u
    基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。" X) N+ e: a3 ^4 D9 Q. G; p! S
    假设:学习器性能相同。
    : X7 U( A7 b0 F, W+ N 3.jpg # v! Y% ?: o. Y6 g. K
    - v3 `( O$ N$ ^8 a7 }
    ; U$ \# y$ Z+ e, z" F% L/ D
    McNemar检验0 ~) W6 s0 U) j0 d8 C; N8 ~3 k

    $ N( p# P& C1 z; }  G+ k) \8 {卡方分布的解释。/ r# f  E) M2 k. h0 `8 K5 c8 ?
    McNema检验是一种列联表的同质性检验。9 M3 D1 q* n; p8 l

    - x3 n; N0 \$ M/ _# I$ a 4.jpg
    3 U% H! _9 \( T: l+ i/ P+ S7 h# \+ v3 i( b' D$ F' [
    一个数据集比较多个算法的检验
    : F4 o5 t8 c1 V; R& w' z
    4 R0 C6 T. Q5 u6 g, C, {7 Y两种思路:$ F7 u+ X0 i" q7 O5 V5 W
    ' e8 f  f) t% r
    算法使用上述方法进行两两比较,直至产生结果。* p; F8 l; }) W7 M1 f2 j  q
    对算法结果进行排序,如Friedman检验。
    % `9 w9 a) u1 L' m& _. ^Friedman检验
    - F9 z( G( H8 D: T7 O& l" U7 M& W4 ^  P
    先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。
    ) @9 F& j# E) F
    0 M5 z: k  X1 F0 Q* C6 { 5.jpg
    ' h& x0 g: m; O8 J$ l: G1 W7 k2 l; x  a: G4 l, i% i" D! t$ g
    Friedman检验图 6.jpg 1 L# n8 B4 Q# a/ v( r
    " }. `5 t- ^* B& e% O
    F检验常用临界值" _! t' y3 H8 i% `+ z- X% m
    7.jpg
    + Q" G8 d3 a5 E( z: gNemenyi检验常用值 8.jpg 9 n2 [* U  ^# z: F* E8 ]6 Z3 g4 r
    ! Q: p/ p) z5 `7 }" |# K% G
    ) N9 u% }9 B+ B! \; c
    ————————————————, R% j7 y+ H) |2 m4 S/ C, a5 l
    版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    0 q. t' [: L- J" @9 |& D; @原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
    7 {2 b. J% R+ K
    ( n- C& v# B3 ?- `6 }( L
    ! w8 O  h: Y! d: |
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-7-14 01:13 , Processed in 0.281999 second(s), 53 queries .

    回顶部