标题: 离散函数的数字特征及其R语言的应用 [打印本页] 作者: 杨利霞 时间: 2021-6-24 16:22 标题: 离散函数的数字特征及其R语言的应用 3 Z& ?) o; u: K; H; \' }& e 离散函数的数字特征及其R语言的应用 8 D# W" A8 j) p: Z3 F2 w' G" [目录 ( a9 C4 {# Y( K% Y' D/ @0引言 ) C0 Y+ N3 m" Z5 }本文结构" W8 F' k, Q2 Q7 H. z: q
理论公式 , E5 m6 P3 Y, ]4 X7 D9 @# J5 K1、几何分布 * S/ ~3 k9 B, R+ W2 T2、负二项分布 ) }+ x4 @3 Z. E9 S3、帕斯卡分布2 H' Z& Z3 C1 s
4、泊松分布 z0 |+ F1 Q) M& d, {2 x* v5、 参考链接2 t& \5 V( C6 v( n
0引言 + G& p* t5 R+ V f; L1 v本文结构 % X( V' r- O8 ?: U9 S5 n( \3 e0 ~在文章统计学基础——负二项分布的数字特征1中介绍了负二项分布,在博客2中介绍了离散分布的数字特征。/ B6 p- @: y/ F, v2 z
本文计算一些离散分布的:密度函数、分布函数、均值、方差、偏度、峰度、特征函数、矩母函数 9 G3 N% ]0 Q5 ~/ {& m! w ' x1 e- u4 h5 _- M$ k. I' M8 h/ M' p2 i9 I: t* \! o9 S
理论公式 {1 K; k5 j% \9 ~' Q% @" }2 \ j为了方便先给出计算公式: / e1 R. j; s* C$ T) [ $ ?5 y; @& R5 t* T ' h9 [7 @- Q0 p# w( y; E( j. p+ s– 密度函数:f ( x ) f(x)f(x)! \8 U2 @! Z. a* [" F0 M
, s' P! D- Z% m: W
7 j; z5 u* J3 A* D! {( l1 g; Z) M+ o# O
– 分布函数:F ( x ) = ∫ − ∞ x f ( x ) d x F(x) = \int_{- \infty }^x f(x)dxF(x)=∫ % O5 E2 R% v$ O8 G$ d o−∞& T" v. c C; p' X0 P8 X1 A
x 6 ^2 J% H) P( E" @& b# u& ~3 ? * Z5 B: Z: f+ v/ x, k f(x)dx - y7 C5 i+ r* h( y% L$ K0 g! ~ M: b* D# s7 J
" Z5 [; M: Z- W
– 期望:E ( X ) = k 1 E(X) = k_{1}E(X)=k 3 z) U. u. y8 _/ F4 a" T1; c1 O' V8 C7 y1 A# t
) |% e/ c* ?% ]1 g, ~, g
+ D# Z. g! A b9 T
% }( B7 P% X4 c8 J; o! P0 c9 D+ K 7 s8 k9 V7 A9 X) B5 v2 I. R# F' G– 方差:D ( X ) = k 2 − k 1 2 D(X) = k_{2}-k_{1}^2D(X)=k ' ]' u) o: H& o, O I2 M* \
2; {2 ~# z) ?! D. U; I7 X$ H( r" x
$ k0 T4 a O/ C' d/ c −k 8 N3 j; Y, y2 T+ Z1 R
1! l6 X0 G: f$ L# v6 f* @
2 1 E T, _, f, Y+ W& ^ * K% d+ b; ^4 o4 w
2 w& S5 i: j; Y+ X7 V- o; a
6 P6 u# Y6 ~6 n% k0 w , b, G5 F, @; t; m* Q) V8 M* z" j6 N– 特征函数:φ ( t ) = E ( e i t X ) \varphi(t) = E(e^{itX})φ(t)=E(e 7 z' A; v% E, W' R7 X. _6 TitX k5 |3 n+ X- i* ^3 Y ) ' N3 G5 j9 M, `8 Y5 w 7 M) B R7 S5 K. i1 A/ r4 S. Z: m2 [5 \# K# j- q& W+ w
– 矩母函数:M ( t ) = E ( e t X ) M(t) = E(e^{tX})M(t)=E(e ; k/ o7 J0 k* w$ K* J8 n1 y
tX $ p5 }& N* h: h ) ; V3 Z4 M5 {3 q $ P9 P7 }/ H q $ S: S& W2 H' e– 中心矩的关系:E ( X k ) = i − k φ ( k ) ( 0 ) = M ( k ) ( 0 ) E(X^k) = i^{-k}\varphi^{(k)}(0) = M^{(k)}(0)E(X 8 i- e6 Z( @# O: f: qk* G" v3 V: P) D# t
)=i - k3 A! Y7 z! y p) E# o+ l/ n
−k* e7 ]: t0 j4 ~8 k7 z
φ 3 S5 j. m4 C: a' w
(k) . z' y2 [2 P. \$ V; i0 y, N. p (0)=M 5 O$ g8 a& i8 j(k) 3 K d3 r; `! [+ \2 T: W0 b. T3 g (0) & l, I5 _/ E" k F; ]4 ~+ |2 G, Q ' m5 e; e% E: `$ \; f* Y" h8 K# Z2 Z, w+ p: o X6 x
– 偏度:S k e w ( X ) = k 3 k 2 3 / 2 Skew(X) = \frac{k_{3}}{k_{2}^{3/2}}Skew(X)= # o, t( S; H0 N' a; X
k 9 U: q8 c; g+ P4 J
2- F# b4 a+ u; `
3/2) t: R& m4 u1 J5 @
' P- J4 T) ?7 E- L
/ v( O$ N0 v" ?6 q' E
k 1 d( y! b, A; {% }3 h) ^2 b3* ]- V$ y q* ? a
$ y# N0 f( k% g / o) B0 w5 K1 b3 U. e
! z+ J$ {1 w% V8 @
3 9 \1 ?; Q- m% r" `& E1 d. @/ H5 f; g* u$ A
" A5 v5 @( S$ I1 w/ q
– 峰度:k u r t ( X ) = k 4 k 2 2 kurt(X) = \frac{k_{4}}{k_{2}^{2}}kurt(X)= 5 l) d; _& d( t& a4 J
k ) }. A7 J+ F" Q( M9 T4 H* X4 }) r& P
20 A% I2 Y" ] l( j
2' l q/ ~$ h0 j# v, C" t7 i
, x% B+ A4 f: _2 L: l ! x3 r1 r! J; A/ v7 r+ [+ w- W
k ; B7 L, U* [7 h( @$ V1 a4 + \" v+ ^% Y1 h # H+ w6 p0 Z3 A/ c* X; v
, s5 w& p5 k4 z* P% ~
9 E( ]$ v) o( j0 P# ]. W. t
4: g, \3 c' c, @0 @4 R
2 J6 ~2 r/ I4 O9 c4 d5 m \, H m k0 x
1、几何分布 & ~! K1 g0 _0 c% \% a1 V+ c– 密度函数:f ( x ) = ( 1 − p ) ( x − 1 ) p , f(x) = (1-p)^{(x-1)}p,f(x)=(1−p) & j( g, l0 l0 y. j8 D1 H# \$ o/ \(x−1) ) t9 P5 n s3 y/ L8 ^ p, x = 1 , 2 , 3 , . . . . . . x = 1,2,3, ... ...x=1,2,3,...... ) W( A/ L; c" J3 c4 v. x" `' G- D1 {5 n
* E* w% u1 N, R6 M
– 分布函数:F ( x ) = ∑ k = 1 x f ( k ) = 1 − ( 1 − p ) x F(x) = \sum_{k=1}^x f(k) = 1 - (1-p)^xF(x)=∑ - L3 e$ I2 B2 M! ^4 e
k=1. {" `6 n% K4 C- X, Q/ ]
x * b& F1 o4 U* |) V8 L " D$ {$ P0 ~/ _1 [ f(k)=1−(1−p) " N: p0 {" P& l/ f3 w1 \" A9 q1 ?x& z4 ^3 `9 q0 n8 y, g
6 d: z( I. j: \8 [, A% t L1 A2 Z5 }+ d) `
$ Z1 R. b1 a. y! ^/ ^# ]: \– 期望:E ( X ) = ∑ k = 1 x k f ( k ) = 1 p E(X) = \sum_{k=1}^x kf(k) = \frac{1}{p}E(X)=∑ . ?- }" w. j0 Bk=1& X. G- N9 |; m {+ O2 r
x/ @% L$ |) V- y, _0 R8 e8 A
+ ?2 L$ A' [% q# k2 f' N7 x kf(k)= 7 F( M$ u1 g6 y, L8 ap 6 i1 @; d( h1 O; A5 @ W1, ^2 ~" U1 [7 X" x8 B
6 C) d. Y! a8 h E$ c9 \3 Z3 x( e: Y' t
1 V5 `. p' x# Y5 Z J6 a9 N. V0 y6 U: A; w) [: Z x! Z
– 方差:D ( X ) = ∑ k = 1 x k 2 f ( k ) − E ( X ) 2 = 1 − p p 2 D(X) = \sum_{k=1}^x k^2f(k) -E(X)^2= \frac{1-p}{p^2}D(X)=∑ 2 i% J+ n+ v$ D! i0 b" V" t7 ?
k=15 } a$ s: f+ M9 s' A7 H; d- ?
x6 M, l/ \0 a) o5 v
! S5 y2 E' n G; T% r2 D# n k : G7 D% [# f1 v2 m# Y$ u
2' U7 T- m/ o$ z% ]
f(k)−E(X) . I- `- L5 {- v0 l
2 7 `7 @0 T' J9 e# j = # _/ C# [" Q* r) T. ~7 h6 R
p # H3 n3 C! C- }! C
2) Y+ H( k" y4 {" t0 w
; g v# N2 U! w% M* y. n; h ) _& }7 H. e/ S3 q; Q% |– 矩母函数:M ( t ) = p e i t 1 − ( 1 − p ) e i t M(t) = \frac{pe^{it}}{1-(1-p)e^{it}}M(t)= , M7 M; L1 H5 R& g* b; h
1−(1−p)e ; ]0 @' v( ?3 ? A( d, s3 }
it( M H6 x/ ?! h/ K. h% z d% y+ s
1 Z. Y& X8 I! X! E* ~: V- u0 f( jpe 0 o/ w# B6 @% w* Z/ ait! Z4 ^: R }3 K [, C. ^/ b
) {4 q% R% D5 `: P ' x1 G! z7 f" B* I# N– 偏度:S k e w ( X ) = 2 ( 1 − p ) 1 / 2 Skew(X) = 2(1-p)^{1/2}Skew(X)=2(1−p) " W6 I' [1 ? Y4 W0 a( f) O
1/2 2 _$ H& A/ T! {/ O* |5 u! W / m) Y% x3 i( Z) J Y4 Y/ d
8 k8 u: T+ y- `6 a
3 {& i" C) P. r9 r
– 峰度:k u r t ( X ) = 9 − 6 p kurt(X) = 9-6pkurt(X)=9−6p6 M+ q( w/ B5 O
) q Y* K( H1 q( ?" _2 G- } ) L& G" f( M) J) l/ k3 C+ O函数 功能 & T" k( z% B8 L& e* ^$ adgeom(x, prob, log = FALSE) 概率密度 0 e4 X5 z& C: W ipgeom(q, prob, lower.tail = TRUE, log.p = FALSE) 累计密度 ; H. O6 a' ^; L: l- y1 M3 h) Oqgeom(p, prob, lower.tail = TRUE, log.p = FALSE) 分位数* ^/ H3 ^0 F% B8 E
rgeom(n, prob) 随机数% f" N$ U/ ~/ f _3 t! T5 f
几何分布的各中心距来自5: 8 Z4 o6 ]8 y ~7 P- ^: |/ ~* [& q2 b, W2 ^
2 O6 s& F# i3 x0 z% G; K
) n- e- J% K" t |2 x
' y8 T" w$ l% l
2、负二项分布; ~' g. \3 |$ a+ e* o% v! D, \5 x
– 矩母函数:M ( t ) = ( 1 − p ) r ( 1 − p e t ) − r M(t) = (1-p)^r(1-pe^t)^{-r}M(t)=(1−p) * _. b" E- S! ^
r6 \: o) S; O' c" r; {; e
(1−pe 8 ?0 C5 J8 H9 ~% q1 ?
t 8 I! P. F+ Y8 w/ u8 c ) * E6 |2 T. T5 }' m( M5 |−r1 `+ P6 e! _# G9 h7 t! O1 z
3 r3 @5 g! I4 E) `0 l
/ M4 i/ [* o4 L
/ ?0 ~! w- p, _+ a3 o7 h4 k5 _3 i& o– 偏度:S k e w ( X ) = n 3 + 3 n 2 + 2 n − ( 3 n 2 + 3 n ) p + n p 2 ( n 2 + n ( 1 − p ) ) 3 / 2 Skew(X) = \frac{n^3+3n^2+2n-(3n^2+3n)p+np^2}{(n^2+n(1-p))^{3/2}}Skew(X)= " J3 [% L) j4 S. U5 i(n 2 C) f2 J) T4 Z
2* M# s$ J4 D& \! b8 o. p3 w
+n(1−p)) 0 Z, X, d9 j: T2 z3 b; p9 S- l. C3/2& Y# G9 C3 U' Z* S3 j
T; Y) V" I a2 Q. a8 N1 ^0 D8 hn ( @$ i6 G( d' P1 P* a& P8 C
3 $ r5 p0 v% ^, C" I8 r. i +3n # S" m; P2 J5 b' h2' A+ E* W4 N) E0 B
+2n−(3n , @& Y9 m( O& c- j+ H1 y( O2/ B/ N7 D1 d: j4 X
+3n)p+np 7 m) K. s$ k, _28 v) }( C; W5 k% z
[7 S7 C6 x- u w 9 G( @& |6 a, z0 o* {: _' K 8 m b" J; e) E' L b6 e7 p. S2 I2 j9 v5 W' g
) G7 v# i) L, ] N4 B( J; v: ]; a
– 峰度:k u r t ( X ) = 略 kurt(X) = 略kurt(X)=略 (带入递推公式自行运算) & l, r+ }$ g7 _$ I3 v. A* U0 N $ I M, j. c J; P5 w , [' y# n5 ~) C7 k+ T2 x9 I函数 功能7 X. _4 q% K8 ~: q* G; ~
dnbinom(x, size, prob, mu, log = FALSE) 概率密度 4 F, q$ c8 _$ u* w# Rpnbinom(q, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 累计密度+ l) L3 I; B; P: [. q) @2 g
qnbinom (p, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 分位数& f" y& E7 P. d/ a
rnbinom(n, size, prob, mu) 随机数6 N9 r3 H* f0 H7 k
负二项分布的递推公式如下:6 5 M" R; N% |) ?4 P I- ^2 h& ?4 Z$ l
0 C% O9 L; p$ {' L0 B+ M+ F G 8 k, _( P) |# o+ J 3 H6 R6 I8 L, _# s% m% |, D , l J# G, }. a X: `" C. a: c! _7 m& Y. b9 @
% |/ P% C$ Y* ~5 E Q
* k$ C9 Q8 N; A, ]* [4 t3、帕斯卡分布 " L R" C! y' rX XX服从r , θ r,\thetar,θ的负二项分布,Y YY服从r , θ r,\thetar,θ的帕斯卡分布。有Y = X + r Y = X +rY=X+r。即:在同样的实验中,帕斯卡分布是成功r rr次后实验(成功+失败)的次数,负二项分布是成功r rr次后失败的次数。负二项分布的数字特征推到见博文1。故帕斯卡分布的数字特征可以由负二项分布推出。 % u8 d5 ~* w* Y( S$ ^( V$ x8 J在R语言中我们仍可以使用下面负二项分布的函数做适当调整生成帕斯卡分布。 C" k- W7 X2 m# O2 C- p {注:在百度百科7中还有另一种说法是:5 D: f& ?; ?4 ]( B
5 Z. x; G, t1 h& I V5 C& }7 i8 D7 I& _( _0 q" s
帕斯卡分布,负二项分布的正整数形式,描述第n次成功发生在第x次的概率。( p& x4 a0 ~( O- F6 L6 N
) E6 ~% F: s, a. i4 m2 [# B6 j7 e, G6 i9 `% ~
我们在课本中见的比较多的是负二项分布的整数形式,这时候课本会标注又称帕斯卡分布,类似于二项分布,负二项分布也可以推广到实数上去定义。大家感兴趣有的可以去自己找资料文献考察一下,这里就不过多的讨论其定义和数字特征的问题了。) r5 ^+ C3 a1 ^2 \+ \
: t. j5 L* J: v- z% K" [! N
+ l0 {2 l }8 T( ^
函数 功能7 R2 z8 D3 x5 N
dnbinom(x, size, prob, mu, log = FALSE) 概率密度8 o. t3 e2 k% P7 c r0 A7 p
pnbinom(q, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 累计密度4 ` H$ r4 b$ ] m, Y9 ?
qnbinom (p, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 分位数8 H8 Q# v/ d* z) |* e5 s+ c3 k
rnbinom(n, size, prob, mu) 随机数 ! C$ S- ]1 h( `3 ?1 w4、泊松分布6 l& H0 B% }6 A ]
– 矩母函数:M ( t ) = e λ ( e t − 1 ) M(t) = e^{\lambda(e^t-1)}M(t)=e % r0 `* U9 x- e# g6 _
λ(e . R5 F2 A, O. c1 O6 e
t 1 S! w+ o* }8 T; D1 T, j" o( p( M2 } −1) 9 q' u" F* j5 z* U7 q {* D, b 6 H0 B3 t1 f* o. \; ~$ c # `0 B% o) _9 L8 c1 }% O5 U- V, ]- b- {$ K9 T# m! M
– 偏度:S k e w ( X ) = λ 3 + 3 λ 2 + λ ( λ 2 + λ ) 3 / 2 Skew(X) = \frac{\lambda^3+3\lambda^2+\lambda}{(\lambda^2+\lambda)^{3/2}}Skew(X)= , u/ |8 ~8 o% a
(λ ) h" f. c5 f7 o3 S
2 + r8 P( C9 n M- b1 u +λ) 6 P8 j3 s5 X6 g
3/2' P6 [- a# T' ?6 u" J7 ~9 T1 [
' l9 M4 f7 j! G+ k
λ 4 ^$ Z' \1 }! z& r3 F: W
3; W8 ]: K2 E Z' E" D
+3λ ' O7 Q% D$ p+ l2 q1 F& l& Z* B2 1 G X4 j& \. M% P/ i+ A +λ 1 X+ l. f* f) H, ]! T9 d' a' y1 n : d! [+ ^' L/ r) I
* i7 b* m# E$ C9 y6 v9 @! x2 Q
- F' h' r: u! H$ f) `$ y D9 m% V7 R: i0 G
– 峰度:k u r t ( X ) = λ 3 + 6 λ 2 + 7 λ + 1 λ ( λ + 1 ) 2 kurt(X) = \frac{\lambda^3+6\lambda^2+7\lambda+1}{\lambda(\lambda+1)^2}kurt(X)= 0 T9 D* \8 `. h: ^7 n' Lλ(λ+1) 4 U! f+ r! @6 y7 w/ k' F9 c, b
26 J: c# V) S2 h4 j# ]
! j; Y% U, T8 i, r/ d2 R. V2 pλ - O, f @% k9 ~
3, [5 Y* y/ t& X$ F2 K5 A
+6λ + _' P1 ?, w3 } p/ @27 \: t O7 Q/ Q' s) j: t* a
+7λ+1 5 J& w: }! W% O: }1 i- ^. [* P 6 w2 H1 t$ g5 A: s - N9 ~0 S. _; n+ _ L
3 o) O' m! E; i; }