QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4736|回复: 0
打印 上一主题 下一主题

使用统计假设检验验证

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2020-5-4 15:18 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    使用统计假设检验验证
    ) j" Y; I* @$ V/ o0 R文章目录
    * D; e$ z' F; I4 t& w2 }, w
    2 u5 N. s4 D4 x/ X* N' Q& W+ Q, ^; r常规检验1 ^9 {- S$ \8 c% b7 c) e" @
    二项检验
    * r, X$ I6 w' m( r  n; ^t检验0 j/ |) G+ x" v( ~  I; T
    一个数据集比较两个算法的检验- m6 X" m: b* S* O
    交叉t检验% @/ ?" ^7 u) {
    McNemar检验, j+ \, b8 i! R3 Y
    一个数据集比较多个算法的检验% f: {% `& W7 X0 o
    Friedman检验
    2 B3 v8 F; a7 d& {Friedman检验图
    5 m0 p/ W/ q5 B$ x# N% dF检验常用临界值% J7 c, Z) U! L
    Nemenyi检验常用值
    + ~0 F7 p0 z( ?2 B! u& V' N闲得慌8 X3 j* W1 z0 T3 s9 @, x7 Q
    统计学是以小样本来估计总体。
    3 H$ ~: v7 w3 R+ R: l2 a6 A. P# c' m7 N# I
    在机器学习中,我们若想知道模型的泛化误差,就看可以以测试集作为小样本,以测试集在模型上的泛化误差,推断模型的泛化误差。' o; Z. O% Y6 @0 A, w

    % H/ X" S+ ^3 K* x常规检验
    + U4 Z, `% v+ \* f8 [* {5 ^) M2 S: E; i1 W8 z; _
    二项检验
    % K5 B" s0 M$ y, p0 D3 y
    $ D5 ?& Z5 i" Y7 {4 q* D8 f3 h假设检验步骤及二项分布的介绍
    ( W; m/ X+ {# A  O 1.jpg 9 N/ D/ V5 x( K; i( j9 l( B

    ) w+ t) L+ v2 i9 P; Y
    7 u+ }6 ]% |+ r4 Yt检验7 A0 _0 U" m5 z: K' ]# X! U# y9 ?8 F

    , j3 E3 S! S) Q  H' h" O  q/ P多次留出法或交叉验证法产生多个结果时的检验:使用t检验对多次结果的均值方差进行检验。
    & ^& Z3 x0 x# `$ `8 Y1 C, Nt检验可分为单总体检验和双总体检验,以及配对样本检验。. T7 Z: ]6 {9 A% G9 b! n6 w
    三种T检验的详细区分。
    # f% s8 m/ T  k8 ~- I3 k- U1 N3 }t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。
    * z5 Y; G: y8 x# P) T
    / O# ]) y; f) J! y1 ?一个数据集比较两个算法的检验
    : T, c2 i+ b7 T4 P" X' U2 }8 ~0 g, L4 F' Y
    交叉t检验
    ' Q! `( p7 O! W! E5 w" ?8 j4 Y7 ?! V6 ]
    交叉t检验:一个数据集比较两个算法的检验,使用的是成对t检验。# `4 c7 K7 C3 I5 h- j& _2 u
    基本思想:若两个学习器的性能相同,则使用相同的训练集和测试集所得的错误率也相同。
    . p# ^! }$ L# b, R$ b( G, H假设:学习器性能相同。
    " k' V+ V, F' S! ]5 A 3.jpg
    ! J9 \- A9 a  V; p; E' U2 p6 M  n1 p! ]
    / J. d6 f7 W. v2 p- c6 U( o; c
    McNemar检验( ^$ g, U; X) Q9 b* I
    0 K9 K$ S# f4 k$ e7 N
    卡方分布的解释。
    : D3 H. [6 G& M! \- e3 F& QMcNema检验是一种列联表的同质性检验。4 P5 e4 [2 N  W4 D6 E
    * O  l% m  L6 `% [" q$ q  D$ }
    4.jpg
    6 D3 m; C1 E( w, p8 a+ S$ e! f6 L" K% L9 I  E! m
    一个数据集比较多个算法的检验" n9 Q. r+ m5 w# S6 Y% j" d+ S
    1 ^% T3 c, J( r9 U1 q! s
    两种思路:, x6 V' d  l0 N; ^
    3 ?7 p5 V, r: U" B
    算法使用上述方法进行两两比较,直至产生结果。' l' S/ w8 `# e5 P5 Z4 R$ x+ I: Z3 P
    对算法结果进行排序,如Friedman检验。
    ' {# S5 i+ Q  d* K% }+ R8 CFriedman检验
    3 g1 K" l  Q- I9 i0 r5 p
    , s. i4 [; U1 V, A( m先构建序值表,进行Friedman检验,若假设被拒绝(假设为“所有算法性能相同”),则说明算法性能有差异,进行后续检验(post-hoc test),如Nemenyi检验。
    4 J, E: t& U: K1 m" `2 Y1 Y' p
    7 g- r1 Q9 V: w# t4 k 5.jpg
    - G; R8 D) o3 I5 h9 k( C
    # R8 E! ~" U% YFriedman检验图 6.jpg
    1 ]  o' B7 D; Q0 a2 D$ X
    * x$ p" R! X. K/ v; k# Y# bF检验常用临界值
    - y* ~/ a( Q4 T" C 7.jpg
    - G3 k$ N" B/ _) [0 B1 A& M* PNemenyi检验常用值 8.jpg + K1 P, I* B6 J9 u7 G, y
    " M+ I# M0 }5 c# A, h$ I# Y
    " r. X7 y( E8 T
    ————————————————
    $ ?, j" v& d  s& e版权声明:本文为CSDN博主「一位不愿透露姓名的群众」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    4 ]! ?$ w5 h& S+ C/ _原文链接:https://blog.csdn.net/qq_35182128/article/details/105886333
    $ O; `+ ^) `. p6 F& r( p9 f2 C2 C
    ( W7 N: O+ ?. o. V  G/ t
    * ^' w' c$ f! |; {
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-8-19 14:24 , Processed in 0.540663 second(s), 53 queries .

    回顶部