( {. I& O- _& r& K3 S, K: e离散函数的数字特征及其R语言的应用. ~0 y9 e4 X8 v: b: ^ D
目录$ ^/ n3 |% C8 X9 F- K# m
0引言, R+ e0 Q- i5 n6 R+ s
本文结构 2 X4 \7 u/ ~' g) Z理论公式2 E' {- L) D! Y4 r
1、几何分布 7 K( x# M# u1 j8 P3 @2、负二项分布$ ^: j7 |# I6 I( `# B* G
3、帕斯卡分布 # f3 V9 v9 w( Q# M" H4、泊松分布! t$ k& R, s- n
5、 参考链接 6 ~& c1 b7 r. }$ K0引言6 J* p4 ?# r9 P+ ]+ j
本文结构- n H# u, G. ~( A' M
在文章统计学基础——负二项分布的数字特征1中介绍了负二项分布,在博客2中介绍了离散分布的数字特征。 L% L, }+ e/ v: W5 c
本文计算一些离散分布的:密度函数、分布函数、均值、方差、偏度、峰度、特征函数、矩母函数 Z3 V% U$ f5 ~1 [( F- u: e
, s, ~% h8 d( \( ~
. [& b: C2 k; E; T0 M
理论公式. a# t/ ~* n9 {# P+ j, H0 z
为了方便先给出计算公式:; V) [2 i: H6 U- V) P/ i
p* F7 @2 f, E) n- p
' V6 Y4 ?% ~' \2 I. x– 密度函数:f ( x ) f(x)f(x) 5 j/ J, Y- T- l( q- W$ c1 o2 c- k$ @8 b% r( w
$ }/ _+ C8 k6 a# T f" O( A, e– 分布函数:F ( x ) = ∫ − ∞ x f ( x ) d x F(x) = \int_{- \infty }^x f(x)dxF(x)=∫ 1 {; r9 v& I7 W( j' a3 c5 v−∞6 |8 r7 E+ m* P/ { q- j
x1 G0 e" n' a2 s
2 P# C+ N# j+ f& X3 e) ]: b( T f(x)dx* b9 C _6 i) X- u1 U& ] n& i
/ z" k! s% r/ ~% c. E9 L0 r/ P
+ n- D" k$ C, I. e1 a$ w/ Q2 y b– 期望:E ( X ) = k 1 E(X) = k_{1}E(X)=k ) h5 t2 `( Z1 ^4 n. g7 X1 k6 Y/ r \' @6 C . v8 |1 {% i3 {# v. }5 t. d
5 t% ?3 A( H( {; I! `' y$ P9 k/ L0 [8 ?
/ R! u2 L5 U; H) T( _4 i2 q– 方差:D ( X ) = k 2 − k 1 2 D(X) = k_{2}-k_{1}^2D(X)=k # g3 g3 Q, h u) H7 Z' p25 [- Q( a; P7 {% ^" R1 b( p
; X" p$ k! i- P
−k [5 i. M5 b2 j3 B+ b' A. d1 6 ?0 V$ ^; g% w& S! _" N, A- c2% Q$ y; A( R4 y8 }3 \8 ]( i
+ z, `9 E. G+ U) g, G, ]2 k/ Z6 K f
! y* i. x% [8 Q8 a- y% Q
- S! a" t. O* r0 C; P& V! B 6 }8 S0 m5 \' K0 {3 J. D– 特征函数:φ ( t ) = E ( e i t X ) \varphi(t) = E(e^{itX})φ(t)=E(e - v" B$ ?" [+ VitX% O3 p6 y2 |% I f& \- t2 V
) _. U3 o7 P) K- l1 f# C% e
C# i1 ? f% n, u" s9 d
' A2 a& H+ V* @" U+ e5 \+ n
– 矩母函数:M ( t ) = E ( e t X ) M(t) = E(e^{tX})M(t)=E(e * o7 G, Z( M; K, D n0 J( x' QtX ; ? i; p( G. ?( p5 n ); n. Y* C% i4 p8 y/ h- N
, u9 A8 H' m* m
; D+ w0 x7 M/ o; b+ Q. V
– 中心矩的关系:E ( X k ) = i − k φ ( k ) ( 0 ) = M ( k ) ( 0 ) E(X^k) = i^{-k}\varphi^{(k)}(0) = M^{(k)}(0)E(X 8 Y. v1 b9 P6 C) A
k* E& _0 p9 Z2 r. [7 k+ m6 {
)=i ) {' K! ]4 W$ c
−k. `+ D; p! p8 I! @% t& E
φ 5 d+ ~: t; ?* C7 Z C4 l' F) @
(k) 2 F$ W Y( \3 J (0)=M ' J. a* m l0 f- L+ I
(k)% I0 C% e* s1 T' U* x
(0)9 f3 D% c1 ?- o# H
7 D+ W& P5 m0 M, j3 `, t5 t
7 o, o, X7 I3 m; z7 g* T
– 偏度:S k e w ( X ) = k 3 k 2 3 / 2 Skew(X) = \frac{k_{3}}{k_{2}^{3/2}}Skew(X)= , D3 ]9 L3 r$ \" ^# x* i: Ak 9 Z8 B5 @; C: H2 5 z+ a- G: j! F6 B% m3/2 " ^9 R2 N. L% ?7 h8 B. D z 0 }- l$ R& \- [5 r - H4 K) L9 X m$ V9 @k : p! M% C7 o7 [, R E, k C1 \
31 l& y& O: @, ] S' ]% @. p9 x
t; k( g% }0 D/ J * D3 x M. F# `, Q1 t% D 1 _/ q) j# h2 _- k+ B$ m: K ~ 3( a# M3 a( B; y3 N8 ]
" m$ |# e2 m$ { E/ v+ n c5 F. |– 峰度:k u r t ( X ) = k 4 k 2 2 kurt(X) = \frac{k_{4}}{k_{2}^{2}}kurt(X)= + l* |/ t. k# O3 F H7 m2 ^
k " v. x, K7 @8 |* \8 k3 m
2 / o* U8 b {5 I3 q1 L5 e3 J2# L" [* N( [% u8 h8 Z1 ]
2 A+ l4 ]4 M0 p - \8 F- M+ B4 Uk 6 ?# O7 z. U6 A3 ?2 n$ v2 k44 b4 \& f& J; c6 L
2 c# ~. t7 w8 D$ Z
- {- N. z0 ` j0 t! x6 k
* z4 B* D0 e- \" l
4/ o8 ~6 K5 U8 T
! p# D) I3 z1 `' a: Z- w
9 V" l. J& x! ?) k
1、几何分布" j w0 a% F3 g+ I& T! Z
– 密度函数:f ( x ) = ( 1 − p ) ( x − 1 ) p , f(x) = (1-p)^{(x-1)}p,f(x)=(1−p) % p' B8 J, h2 w1 `8 F
(x−1) 9 d/ t$ {6 T, ]0 l6 K p, x = 1 , 2 , 3 , . . . . . . x = 1,2,3, ... ...x=1,2,3,......# D0 u! c4 n% g/ i5 k
6 r5 ~* U9 `" `% G; `4 w
8 ]/ k( L5 h' m% T% |4 p
– 分布函数:F ( x ) = ∑ k = 1 x f ( k ) = 1 − ( 1 − p ) x F(x) = \sum_{k=1}^x f(k) = 1 - (1-p)^xF(x)=∑ ) ]" c1 _: P+ m* K* }6 h" W( y% J5 o
k=1 ) H t" X T( g" f4 ]0 u g- wx " _" D& _* L: r* g/ Y0 } 2 w- s8 D9 t B; K6 j f(k)=1−(1−p) 8 ?" g+ W, |+ [0 s8 ~7 P4 q
x6 f( Y5 K1 Y/ J3 r! Q
7 F# x9 V! k" g4 l9 k4 K( l& B( G$ t
; E) K. W& v/ P% v0 U6 D
$ ^% k5 E+ v. G }) y7 n
– 期望:E ( X ) = ∑ k = 1 x k f ( k ) = 1 p E(X) = \sum_{k=1}^x kf(k) = \frac{1}{p}E(X)=∑ & b1 g# S# }$ `4 J
k=1! i. t0 N4 Z) B+ h3 g6 k3 n7 Z
x & H! i* i, F( K/ M; a / M8 V" U- c( j/ x kf(k)= # ~+ e6 M5 Q6 T+ U k4 {; np6 T) S+ g2 R B4 g. w
1 8 E. F" W/ D% z9 d' C * G1 M4 N& H; f p. n1 x, M, P
7 }( z+ G2 s* B5 [' k $ P% X2 ?% L4 ]$ p" V9 Q6 j2 X" Y . d% J; O: a6 D* R2 ^2 w& W– 方差:D ( X ) = ∑ k = 1 x k 2 f ( k ) − E ( X ) 2 = 1 − p p 2 D(X) = \sum_{k=1}^x k^2f(k) -E(X)^2= \frac{1-p}{p^2}D(X)=∑ 9 z7 m) K4 Q* bk=1$ x8 d5 t+ R7 f+ {1 Z
x ; }7 I c% S2 l& r. L ( U7 g! E2 | }: W k : N7 I4 u- u Q4 r# @2" p& U& N3 |5 r3 L
f(k)−E(X) 3 x; R) R) x! ^- G. Z6 P5 i- @7 G& F2 8 R& S7 T9 I( `4 t( J0 F = 7 x* M! X% ^0 {; s" V1 T- O9 j3 u
p ! \0 B* B0 v. z, N
2 3 B2 ^, l X/ X2 E- `5 B $ u$ I6 g$ J4 a" S% g' t1−p , z' `0 R% q3 ]) T# A1 X 7 u/ i8 }( i" }6 n8 T) u
$ I9 y) y4 ~6 L
' V$ L( z G, V: @9 E1 x5 y, n. q# k( z
– 矩母函数:M ( t ) = p e i t 1 − ( 1 − p ) e i t M(t) = \frac{pe^{it}}{1-(1-p)e^{it}}M(t)= $ d' N& | e. x. L1−(1−p)e 1 w- K4 M; p/ g0 Y; O
it . S5 P D- G5 N4 e$ {& a, W) O 9 l0 F7 [& }* ]7 R! [pe / O: C# z. ]& w* U
it: \+ R( f& K8 C0 @/ T
" {5 r% p+ E& K8 _6 {. C! \ 7 h2 g4 f i: a
0 N' j0 t4 d! V+ f # q* D! ?* I: D* K( O& c6 \7 S7 m* z 3 [1 D5 M% e* p– 偏度:S k e w ( X ) = 2 ( 1 − p ) 1 / 2 Skew(X) = 2(1-p)^{1/2}Skew(X)=2(1−p) 2 y) ]* ~' a8 ^# f+ H# n- i
1/2, `" `0 H! e. `8 b Y
9 s! y& c* z: _. q5 X5 N4 m( m
$ R8 k# }8 U' O4 l– 峰度:k u r t ( X ) = 9 − 6 p kurt(X) = 9-6pkurt(X)=9−6p - K# C5 t6 ?6 R) C% \: {# }, I 8 N/ |; @) y9 _2 u8 q4 M2 p) O) q" E) p# v
函数 功能 - a% h4 ^7 O, a. [8 ?dgeom(x, prob, log = FALSE) 概率密度 7 f$ f0 H* C6 `pgeom(q, prob, lower.tail = TRUE, log.p = FALSE) 累计密度 u6 ^- | y; J+ S `/ y+ d# f) nqgeom(p, prob, lower.tail = TRUE, log.p = FALSE) 分位数5 r7 `! {0 J9 ?0 K
rgeom(n, prob) 随机数 ) y) Q% H3 R0 l6 j# E) n- D; i几何分布的各中心距来自5: 9 f+ a8 A9 R. V- ~5 y 9 C: n. a+ Y: o4 U/ q4 d9 X( L8 P3 ]5 H+ I; O
. ]) M8 A7 W: d) b4 l0 n5 }
/ k% `& \' y/ o1 c( }; |: s
2、负二项分布8 v: O( H; ?3 w% j' e0 A! `, @
– 矩母函数:M ( t ) = ( 1 − p ) r ( 1 − p e t ) − r M(t) = (1-p)^r(1-pe^t)^{-r}M(t)=(1−p) 2 E7 ?5 ^; {; t" F7 a, jr ; U, S# ~0 S( p6 ~5 Y2 _ (1−pe - T9 D8 |# v% s6 q% Q0 q; h! ut+ E) q) l' f$ \+ G* _- b. T, q
) ; C# H- k- s" B- M+ ]* [−r ! {; e4 t4 U" _# L# Q# L4 x, ] ]. B! G9 s$ I& l; n; [, ` 7 Y2 i' w( d8 k0 t. h0 N. X 7 M* i- ~ h5 F; P6 o5 C! _: [9 _, v. S– 偏度:S k e w ( X ) = n 3 + 3 n 2 + 2 n − ( 3 n 2 + 3 n ) p + n p 2 ( n 2 + n ( 1 − p ) ) 3 / 2 Skew(X) = \frac{n^3+3n^2+2n-(3n^2+3n)p+np^2}{(n^2+n(1-p))^{3/2}}Skew(X)= ( r# Z7 i" m/ F8 u(n # ]2 h( v3 B/ H3 j; X ^
2: I' f$ D) A* V( Y$ p) A
+n(1−p)) 6 ^( o- g3 u6 S: k1 [7 ]
3/2 0 {7 U8 A0 j) g' z3 B3 d- E 7 R% W2 A- e$ Z4 Un 6 e! q% o2 w# J( v3 $ _% O4 F' `6 a5 ` +3n + n' K9 z+ U" @. @2 - _; a5 k c8 j. l! E7 h +2n−(3n * c6 l- [8 {0 v) o/ G* C0 @8 q
2& V; p/ V# L# k2 J
+3n)p+np 8 @4 _" b9 \3 o4 L. ~2 * L' i3 l s L1 e8 T4 _+ t 6 t$ @# y4 X8 X0 z ]2 f/ P; q
# I( b- z& b8 x+ u+ B" W9 e ' Z" R$ a6 N4 K' }
8 W1 Y7 j( O. X+ _
, A7 h- a9 s4 d- `* w
– 峰度:k u r t ( X ) = 略 kurt(X) = 略kurt(X)=略 (带入递推公式自行运算). E% v* a' `: n& R
/ @8 M+ g! e: C0 |3 L2 D7 n+ m R
8 w6 S: i, L; j `
函数 功能9 U0 ]+ Y' j u7 }- x F7 \7 t
dnbinom(x, size, prob, mu, log = FALSE) 概率密度 {) y1 X2 o! R% qpnbinom(q, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 累计密度 4 k" m: r% h" u+ tqnbinom (p, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 分位数; \5 w x- M7 f0 F/ d2 L* {9 o$ n
rnbinom(n, size, prob, mu) 随机数 & ]! z! d% J) L: m负二项分布的递推公式如下:6. b: f* D7 f' G7 N; Z
/ c3 o S ^! u
+ U/ G+ ]. U4 N8 s( ^
; n' w, V- C$ Y8 a0 y
# \) M, _- P! F- T g# U9 \& q2 t) ` d6 U5 \" R) y9 s/ I
; g+ R9 c' v p, G. K4 C0 k: K3 U) G7 d+ C% n h
3、帕斯卡分布 " t0 A9 i K: ^. f' ?+ ?& k3 TX XX服从r , θ r,\thetar,θ的负二项分布,Y YY服从r , θ r,\thetar,θ的帕斯卡分布。有Y = X + r Y = X +rY=X+r。即:在同样的实验中,帕斯卡分布是成功r rr次后实验(成功+失败)的次数,负二项分布是成功r rr次后失败的次数。负二项分布的数字特征推到见博文1。故帕斯卡分布的数字特征可以由负二项分布推出。 ! `! ~5 G1 S" U2 d0 x' e在R语言中我们仍可以使用下面负二项分布的函数做适当调整生成帕斯卡分布。& {. D) z) _- `4 j- ~2 |9 {
注:在百度百科7中还有另一种说法是: & P0 O( `7 ]$ r8 _; V 9 U( d# `- V; Q8 ]/ R6 J 2 Y3 Y. Y0 [+ p2 c帕斯卡分布,负二项分布的正整数形式,描述第n次成功发生在第x次的概率。8 N5 o+ b; f4 g1 Z* e% q