QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3018|回复: 1
打印 上一主题 下一主题

用一个”栗子“讲清楚泊松分布

[复制链接]
字体大小: 正常 放大
浅夏110 实名认证       

542

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2020-11-14 17:15
  • 签到天数: 74 天

    [LV.6]常住居民II

    邮箱绑定达人

    群组2019美赛冲刺课程

    群组站长地区赛培训

    群组2019考研数学 桃子老师

    群组2018教师培训(呼伦贝

    群组2019考研数学 站长系列

    跳转到指定楼层
    1#
    发表于 2020-5-15 10:51 |只看该作者 |正序浏览
    |招呼Ta 关注Ta |邮箱已经成功绑定
    我们这篇文章的内容关于统计学中的泊松分布。
    举个栗子0 {, q1 z1 E0 G3 Q3 N# d6 n' `. b) y
    泊松分布在概率统计当中非常重要,可以很方便地用来计算一些比较难以计算的概率。很多书上会说,泊松分布的本质还是二项分布,泊松分布只是用来简化二项分布计算的。从概念上来说,这的确是对的,但是对于我们初学者,很难完全理解到其中的精髓。
    8 s( i* N' R4 F. [
    所以让我们来举个栗子,来通俗地理解一下。
    * e. r. y' K5 h; c& I
    假设我们有一颗栗子树,有时候因为风或者是小动物活动的关系,树上可能会掉下栗子来,树上掉栗子显然是一个偶然事件,并且发生的概率很低,那么我们怎么求它的概率分布呢?泊松分布解决的就是这样一个问题。
    5 Y/ J% V3 W- x# j& a
    好像没有一个模型可以直接来刻画这个问题,必须要经过一些转化。

    $ O  l; V0 f6 }. y2 i
    其实我们可以将事件切分,将这个问题转化成二项分布问题。
    , @$ v* c# `5 z) k
    1.jpg 6 }2 ^) ^/ ~$ \' H: S. }
    比如我们把一天的时间切分成了若干份,这样对于每一份时间来说,最多只会掉一个栗子。那么,这就转化成了一个二项分布问题。理论上来说不会有两颗栗子掉下的时间完全一样,所以只要我们将时间切分得足够细,就可以保证一段时间之中最多只会掉下一个栗子(否则就不满足二项分布)。
    " E! U# Q7 A5 v7 `! a
    假设我们把一天的时间切分成了n份,我们想知道一天当中会有k个栗子掉下的概率,根据二项分布的公式,这个概率就是:
    / C. o6 C+ B& Y
    2.png
    # I1 ?& M/ ]# O6 [) T& x4 Y/ S$ z
    到这里,我们往前迈出了坚实的一步,写出了概率的表达式。
    推导泊松分布
    ' K$ c% W- {5 f' X( G
    我们虽然有了式子,但是好像没什么用,因为我们只知道p是单位时间内有栗子掉下的概率,我们怎么知道这个概率是多大呢?难道还真的去测量吗?

    , g. r. C* S8 p7 g, M
    要解决这个问题,还得回到二项分布。我们可以利用二项分布求一下每天掉下栗子数量的期望,显然对于每一个单位时间而言,发生栗子掉落的概率是p,所以整体的期望是:

    , R  k$ g  N. ]0 L+ J$ a 3.png   g+ y& w4 m6 ^. v) x9 _' `
    我们令这个期望值是,那么根据这个式子,我们可以表达出p了。
    . a: U4 |7 H& r  }3 Q 4.png
      J1 y) p& F+ K" I! I( D% l我们把这个p的式子带入原式,可以得到:
    9 ^) A8 o, ^' s# Y 5.png / x$ P, c) C% a, q$ d5 C
    我们来算一下这个极限:. ?8 X! c) n' K' |7 n  O7 @* A  x' s
    6.png . R0 T, f1 N7 g: W  u. K* z
    我们把这个极限拆分开来看,其中:5 T) Q5 I& b8 B7 V. |
    7.png
    " B: I, _$ g9 Z8 U所以,我们代入,可以得到:3 }% M  k7 C4 p$ B: v/ L
    8.png 7 M+ {5 Q# ~* b: [" b+ r$ N
    这个就是泊松分布的概率密度函数了,也就是说在一天当中掉下k个栗子的概率就是
    8 f4 e' ]& d) w9 @2 C% I# L1 f
    也就是说泊松分布是我们将时间无限切分,然后套用二项分布利用数学极限推导出来的结果。本质上来说,它的内核仍然是二项分布。使用泊松分布的原因是,当n很大,p很小的时候,我们使用二项分布计算会非常困难,因为使用乘方计算出来的值会非常巨大,这个时候,我们使用泊松分布去逼近这个概率就很方便了。
    结尾和升华
    # C4 a8 Z$ u9 j! e* L
    我们根据推导出来的结果,感觉只要是n很大,并且p很小的场景都可以使用泊松分布。但是这毕竟只是一个感性的认知,在统计学上对于这个问题也是有严谨定义的。我们来看一下严谨的使用条件的限制,大概是这么三条。
    4 G. Y6 n7 z, i
    • 当我们将时间进行无线切分之后,在接近于0的时间段内事件发生的概率与时间成正比。
    • 在每一段无限小的时间段内,同一事件发生两次的概率无限接近于0
    • 在不同的时间段内,事件是否发生互相独立! {( H' L6 A* @/ n) @( g
    9 v7 m: S7 n# w2 c; d
    最后,我们看一道书上的例题,实际感受一下泊松分布的应用。假设我们有一批零件,它的次品率是0.1%,也就是千分之一。请问我们生产一千个产品当中至少有两件次品的概率?

    1 V- C) D) c0 D% w( [
    这道题应该很简单,要求两件及以上次品的概率,我们只需要计算出只有零件和一件次品的概率,然后用1减去它们即可。我们首先根据n和p算出
    % v3 |. {/ n  V" g, s; U1 g
    我们带入泊松分布的公式:
    % F- r' W; E6 c: E) |
    如果我们要用二项分布来计算,那么就需要计算0.999的一千次方了,这显然是非常麻烦的,这也是泊松分布的意义。
    转载于公众号:TechFlow  v( u( s4 ~6 Y* O, I4 o6 J9 A: E

    8 v6 b* L. Q3 j, n. R9 H. O5 g8 X; L# q" w& u! R

    , h6 P9 s$ d: o! {
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持1 反对反对0 微信微信
    德古拉        

    2

    主题

    4

    听众

    165

    积分

    升级  32.5%

  • TA的每日心情
    奋斗
    2025-12-3 23:13
  • 签到天数: 127 天

    [LV.7]常住居民III

    国际赛参赛者

    自我介绍
    嘶嘶。。。
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-9 05:42 , Processed in 0.457945 second(s), 60 queries .

    回顶部