- 在线时间
- 480 小时
- 最后登录
- 2026-6-1
- 注册时间
- 2023-7-11
- 听众数
- 4
- 收听数
- 0
- 能力
- 0 分
- 体力
- 7823 点
- 威望
- 0 点
- 阅读权限
- 255
- 积分
- 2934
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1174
- 主题
- 1189
- 精华
- 0
- 分享
- 0
- 好友
- 1
该用户从未签到
 |
格拉布斯准则(Grubbs' test)是一种统计方法,用于检测数据集中是否存在异常值(outliers)。它基于假设数据服从正态分布的情况下,通过比较待检测数据点与其他数据点的差异来识别异常值。! {0 X8 O, E# b. k3 e4 {2 f8 F
格拉布斯准则通常用于检测单个异常值。它的基本思想是假设数据集中存在一个最大(或最小)的异常值,然后使用统计方法计算该异常值与其他数据点之间的差异,如果该差异显著大于预期的值,就将其识别为异常值。' x I: q0 }% @3 v* d* h3 p
格拉布斯准则的步骤如下:
% N+ v k2 ~* \# s/ j% s
g1 D! W, u# q$ r4 t3 f6 e1.确定异常值类型: 首先确定是要检测最大异常值还是最小异常值。2 j d4 f# ^" G9 k% V/ S: J
2.计算格拉布斯统计量: 根据所选的异常值类型,计算待检测数据点与数据集的均值和标准差之间的差异,并除以标准差。
; a7 o5 c5 O6 |0 o1 z3 A( P3.比较统计量和临界值: 将计算得到的格拉布斯统计量与临界值进行比较。临界值通常是根据数据集的大小和显著性水平(通常为 0.05 或 0.01)以及所选的异常值类型确定的。* H- @: p# o) d
4.判定异常值: 如果计算得到的格拉布斯统计量大于临界值,则将待检测数据点识别为异常值。+ X& S" l5 k3 K0 N# q( ]
5.移除异常值: 可选择性地将识别出的异常值从数据集中移除,并重新计算统计指标。
- Y" A. ]% O- Q$ T1 _9 t+ w( H' d/ G. X. I
格拉布斯准则在许多领域都有应用,包括工程、金融、生物统计学等。然而,它也有一些限制,例如对数据的分布假设要求较高,且可能对数据集中的多个异常值不敏感。因此,在使用格拉布斯准则时,需要根据具体情况进行谨慎的判断和分析。+ U0 n2 ^" s& ^7 m7 f; y) i4 w
$ B4 r4 p6 |) r" j( M" V本文将为大家提供一份基于格拉布斯准则判断异常数据的代码,在附件中7 B* z9 x" [9 D# B; v9 \4 T0 n$ u* S
7 J8 V- G( ?3 K6 `# a `' z" o" U# v |
zan
|