QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3234|回复: 0
打印 上一主题 下一主题

使用统计假设检验验证

[复制链接]
字体大小: 正常 放大
杨利霞        

5250

主题

81

听众

16万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2020-5-4 15:18 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    使用统计假设检验验证2 G: \2 b# C, q: ]7 F+ e. X" _# }
    文章目录
    8 n/ b2 R  \' ?; P0 n" I2 Q
      T" r& a4 x! {1 A9 q7 }常规检验; e/ Y+ x& j, ~  M0 f! H- U' l# ^
    二项检验/ k5 V, [# T8 a* Z- N
    t检验
    - ^( P( @1 v: t) Z4 |一个数据集比较两个算法的检验% ]% f  I$ T' Y% q9 J7 y1 L. d
    交叉t检验
    , V8 M: \$ ^: R5 H2 QMcNemar检验7 x" H' B: l# f* v3 o6 Q5 s+ P
    一个数据集比较多个算法的检验# R( G) C3 G- [) n
    Friedman检验
    0 }6 {2 w6 C4 p1 C8 x. ^! OFriedman检验图
    * O/ j2 O" B! \+ _F检验常用临界值% y( t8 }: R7 j" ~- K, f5 f$ ?
    Nemenyi检验常用值
    0 [8 j5 n2 q" H5 \闲得慌: S/ d" V6 Z$ N3 ?- ^: l6 |
    统计学是以小样本来估计总体。
    , j- `9 `$ Z% ^9 c
    " K/ x$ ~! F0 _% W/ P" E8 t在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。
    0 b3 J: I, n8 j+ D: ^
    1 D& x5 E: ~) e, S3 M; e常规检验
    0 n9 K% @7 R6 w6 L) N: }' O0 }' \* a# u6 K" c
    二项检验
    ' a- O1 y$ l2 n" f9 u% d8 U7 X- B- g" x! c* i4 D2 |4 {
    假设检验步骤及二项分布的介绍
    , Q6 K8 x& Q' }, X% q 1.jpg 6 p' Q. W- u) x7 j* M
      i* N4 ?+ }1 _. c
    0 D; V, C5 ^1 {8 Q# H" a0 w
    t检验( Z) v' k; \/ H0 m* N0 D

    % p1 y, J+ G) w1 A. e3 L" |多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。& V8 z& I$ b7 [
    t检验可分为单总体检验和双总体检验,以及配对样本检验。4 g6 {4 P! p9 }3 G0 u5 e
    三种T检验的详细区分。. I+ Z* F) Y% H6 v) Q- x% k
    t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。  m" m% Q5 _, e" W- c0 P) e" l
    ' G, Y) J. f$ R% g
    一个数据集比较两个算法的检验
    & S6 [- {5 T( g: z; ]" A6 ?* y% v8 W. I* ?" I, @1 l
    交叉t检验
    1 `9 A4 h% w! V# d5 `: Y/ \4 u/ J  z, p7 O# X
    交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。3 u. F( O/ N& ?, A' t
    基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。
    / g2 r1 `1 t2 ~6 y8 S3 D假设:学习器性能相同。7 R6 ~3 }# ^1 E7 I5 M8 N
    3.jpg + }! O) ]  D6 L1 I
    + w1 r$ X9 j( I' W3 u

    9 h/ q0 z' Z0 P' d4 Y% NMcNemar检验
    * \- v4 f* Y7 g5 B5 M: s$ T( ]  r$ a* g) ]: b
    卡方分布的解释。- U: U- v# y* k1 H0 s7 E# x" t1 m8 o
    McNema检验是一种列联表的同质性检验。
    # |2 S% V3 f; P- v2 M0 h# x
    5 D0 a3 J6 z" s 4.jpg 4 l% h  f& o2 N

    / B5 K7 b( B7 h2 G一个数据集比较多个算法的检验9 H# ]% y3 p$ b1 y0 L# i- m

    $ K: n4 n" O, S2 F两种思路:, L) d6 E5 H# K

    % E4 B1 i. l2 m- C/ b算法使用上述方法进行两两比较,直至产生结果。
    # M- Z. A" z3 s; H% P8 j! w* o. k; t对算法结果进行排序,如Friedman检验。! _  Y3 l8 |* n
    Friedman检验
    , u0 _6 Z2 x- F$ p" R
    # |: o& c! J: H2 Y5 w先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。# K2 \1 p6 B% t1 |" R

    3 f, U5 l' S0 I 5.jpg 0 b/ y, M8 b8 u
    , ^2 j" k) a5 `4 t* f
    Friedman检验图 6.jpg
    . L1 _4 a8 w/ X' h1 P- k* ]8 [; l- E9 r/ H
    F检验常用临界值
    1 d  p" ^4 A0 t* G" ?; S 7.jpg $ a3 \- T) G3 L3 |2 @
    Nemenyi检验常用值 8.jpg . S; G3 {3 Z, o" J; N
    + F2 [, b( a7 W

    2 r4 v& O: }3 X, G* o- v9 \2 s8 L  d————————————————! S0 J# J; c* u
    版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。: @; E* Q: o. B# ~( A/ ?* h8 G/ U
    原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333: W1 o6 C% k# E- J
    ; m6 x" C) C8 F5 Q$ J$ u

    + h) f2 @8 W9 r% w5 E
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2024-4-25 23:07 , Processed in 0.435537 second(s), 53 queries .

    回顶部