, Y t# h6 C6 j, \: l! W$ h$ r离散函数的数字特征及其R语言的应用' P' \1 n/ i- g4 F3 X Z* P& A5 R& S8 ~
目录8 K* R; V" d8 U- o: H
0引言" a2 {# {' z5 z
本文结构 ; H- X1 \9 M" `* A% Z( Y理论公式 & y; D) J4 J$ l1 I2 _" X1、几何分布. k# Z8 Q/ I2 P' K/ ` ^; X
2、负二项分布 ) ~' i3 b9 f$ d6 |6 t3、帕斯卡分布- |1 F3 U* D$ i! w1 c. R4 C
4、泊松分布' `" R5 v0 @$ N: V# O% r; h
5、 参考链接8 @, w8 Q3 Q4 b* p. _/ S
0引言 * |+ I1 D9 }) a* |/ v) _7 R本文结构 8 h& t0 t' D9 o2 k! N( h在文章统计学基础——负二项分布的数字特征1中介绍了负二项分布,在博客2中介绍了离散分布的数字特征。 , O: r; t7 U/ `8 S5 m本文计算一些离散分布的:密度函数、分布函数、均值、方差、偏度、峰度、特征函数、矩母函数- {$ N ?9 Z. f
9 _4 i- V; C- ] * ]3 _( k3 ?9 w3 Z" j6 E理论公式 ! | q* n: s1 n. X4 H S3 C2 K6 g为了方便先给出计算公式:0 v) _$ D @5 e2 h! \) Q' e, f2 g
; R# v; g0 D' b3 g2 `' p& j1 x , i4 ^7 k% Z2 ^– 密度函数:f ( x ) f(x)f(x)+ d" g4 ]2 u, c
9 v: b' a3 q, S$ u! m1 {; q0 K
/ @$ v p, H( d" U' n- P
– 分布函数:F ( x ) = ∫ − ∞ x f ( x ) d x F(x) = \int_{- \infty }^x f(x)dxF(x)=∫ 3 p( x! D$ y, e$ K. Q. R: f# T8 Y1 K−∞ % J$ Y" { q7 Z: Ax% e; J/ h; g/ W5 M1 B5 g/ a
; N* C. N6 a6 L3 \ f(x)dx+ Q' a0 M1 u, a0 `" w i
9 c& K c& m2 j X1、几何分布 2 @4 f# I) N0 _– 密度函数:f ( x ) = ( 1 − p ) ( x − 1 ) p , f(x) = (1-p)^{(x-1)}p,f(x)=(1−p) / }. G0 a4 ?6 @7 v0 d5 N
(x−1) 4 T" h5 n0 f9 ? G p, x = 1 , 2 , 3 , . . . . . . x = 1,2,3, ... ...x=1,2,3,......' ?8 f9 i3 a' S) [1 V/ X* j
+ {6 e) x' _; v) s $ f7 H w8 x4 b3 C ]( c. u1 d– 分布函数:F ( x ) = ∑ k = 1 x f ( k ) = 1 − ( 1 − p ) x F(x) = \sum_{k=1}^x f(k) = 1 - (1-p)^xF(x)=∑ y* F6 f8 X7 ?# F1 e* ?& Qk=1. i7 v" U4 p6 y9 p1 G
x$ n4 h' a" }* [1 t8 }
5 U) D! Y2 A, G0 |0 s0 G: U) T* J
f(k)=1−(1−p) 5 Q4 l8 R b* f& U0 nx' p# e5 l8 N* ?) `
+ x% @) V1 Y; z# j$ X& M; c
$ s0 ~4 g, |- g4 t. D! G8 M : A6 h" K% E0 Y! T# e– 期望:E ( X ) = ∑ k = 1 x k f ( k ) = 1 p E(X) = \sum_{k=1}^x kf(k) = \frac{1}{p}E(X)=∑ 8 |1 J- ?# i6 a; Ek=1! v' w, M+ A9 Y# K5 f
x ( l2 a! B7 ~2 g, {7 N* c7 m, Q & `& {7 P+ e/ y; F& W& o) k kf(k)= 2 e) H$ r. x/ S* o4 q1 mp- k+ a) i/ G& Y" D* T
1 1 |% p% H! l0 F8 z% [+ o6 o% o ) y6 e$ r y$ [3 Y ( R' T+ S. g d0 K, P: Y : I2 s ^* s6 s' K* {1 m# k & j" n! i$ q) B0 i7 m– 方差:D ( X ) = ∑ k = 1 x k 2 f ( k ) − E ( X ) 2 = 1 − p p 2 D(X) = \sum_{k=1}^x k^2f(k) -E(X)^2= \frac{1-p}{p^2}D(X)=∑ ~: x9 q f3 b3 M7 Uk=1$ \, ]3 n: Q' R( u/ G0 M& G* N$ C
x ( M# A; x1 y% \. `9 b X% g! R : J( j4 c2 G$ b8 I! h. X
k ! {+ O9 C) l4 D3 @" ?/ P
2 s! ]$ S" x- N! r( ?; h/ E% z
f(k)−E(X) % i+ l! ^8 A) Z2 1 `( B! ?1 J7 i. a/ t = ' ~* }$ p' _+ u5 D7 z$ e
p 5 _" j5 A" Z4 y, P `
2 ' `5 f$ T( }1 [0 I% j% ?8 a. t, w1 ~ + u& a0 w2 r8 e4 f6 R
1−p" N! N; \/ w: j4 f
! G6 q' R& h4 t1 ?# @8 t % X3 R X1 U8 U+ g D. g
% s8 k( i6 ]6 A4 d( \7 ^ 1 o, z" q8 v/ x: Y( R- U– 矩母函数:M ( t ) = p e i t 1 − ( 1 − p ) e i t M(t) = \frac{pe^{it}}{1-(1-p)e^{it}}M(t)= $ ` r+ j9 o* I. [
1−(1−p)e + \+ { v3 o* D' P) N
it- r, c! N' R5 X& M! L
' _* k* @1 v' b4 }$ ^( d7 Spe ! ~4 e5 _# m6 W8 Lit7 f) `9 ~. a- Q# c' G
0 U5 P" L; r- J
& i4 i6 v! v- r p 2 |7 T$ C( ^" O: y C+ F+ m9 _% ?
: ^) ^% |) P, H9 P T0 i* d8 h @% r$ n3 U, @: ]7 t8 `/ y
– 偏度:S k e w ( X ) = 2 ( 1 − p ) 1 / 2 Skew(X) = 2(1-p)^{1/2}Skew(X)=2(1−p) ; q" ~* c; D+ u% ?4 L: ^
1/2, e. v( C- Z! E+ m2 x4 ~5 a
& P, f) @9 p- Y( n. h $ k m4 g1 b' f: f1 ], {4 `9 f; b* w6 ~( ~- K
– 峰度:k u r t ( X ) = 9 − 6 p kurt(X) = 9-6pkurt(X)=9−6p; u* e4 w( y9 n9 Z. j; W
7 z! K, R q) ~+ A) f5 _) B
) r6 L3 `- c2 `) e/ w
函数 功能 & z+ n$ f1 C+ P5 M5 Bdgeom(x, prob, log = FALSE) 概率密度 0 B R7 i; Y$ A% S; Ypgeom(q, prob, lower.tail = TRUE, log.p = FALSE) 累计密度 - p0 k" l/ h) Q7 l6 z6 cqgeom(p, prob, lower.tail = TRUE, log.p = FALSE) 分位数9 I3 M) b! N0 i. ]& e
rgeom(n, prob) 随机数2 e: ~! }3 @$ f" v+ D
几何分布的各中心距来自5:. M/ j( V. {4 s7 ^7 v T
& N* I* r3 f6 o% x' T + _& e- E; }1 N+ P , x. s3 C7 F; m5 U7 B" V! x, i, s M, I! @2 ]9 A
2、负二项分布2 g% u- D3 f% F u8 v# A
– 矩母函数:M ( t ) = ( 1 − p ) r ( 1 − p e t ) − r M(t) = (1-p)^r(1-pe^t)^{-r}M(t)=(1−p) * h. o. h6 c7 i/ Q$ c! X! u3 P
r 6 L: x+ H2 h! J% d# t' R (1−pe ! s2 z H- M7 K9 i( { E6 Y- ]
t& s5 s% }! p* Y/ E t
) # ?' I* n6 v, \0 T−r ( {6 H& C# _# `+ {" \* n) c( ]1 Q 9 J- j% [. F, e9 C
3 n" Z: l. R( Y' O; Y# ]4 R. M
& c4 W! @8 y6 i
– 偏度:S k e w ( X ) = n 3 + 3 n 2 + 2 n − ( 3 n 2 + 3 n ) p + n p 2 ( n 2 + n ( 1 − p ) ) 3 / 2 Skew(X) = \frac{n^3+3n^2+2n-(3n^2+3n)p+np^2}{(n^2+n(1-p))^{3/2}}Skew(X)= 4 P/ E, B: @* F# J1 R(n : G( G2 m) M8 k) v, r
29 j$ h9 J8 K+ q7 e
+n(1−p)) 0 R, s) [5 J4 b8 N
3/24 O" Y. d: [; I( f' U
0 l, \ f( \/ gn 5 F% W8 _; y# |! N* O. \
3 % k* \/ B: G$ ~ +3n . k2 G9 B: Y+ p" A5 C
2! @; i: g$ p. d8 }( t% U( M
+2n−(3n , r% G7 e* C& m1 [ s3 z2 E5 W2 0 E. V6 K! n5 G2 k +3n)p+np 3 N$ ~5 ^! j' h% g' Z* ~2* \. p& p, G7 q& w! b9 J1 U
0 |- y u7 ?4 J" `+ K" d, A) ?
, p% W2 C) j% @2 S8 X Z' b+ J8 s ; f9 e e! X+ u, H. A + H5 W2 W- |% K9 A: G # P. b5 Y, E' k+ R– 峰度:k u r t ( X ) = 略 kurt(X) = 略kurt(X)=略 (带入递推公式自行运算) " m& o! S+ j5 v f ' g* X/ e$ ]5 ?( n/ Q- K - B$ H H$ O _函数 功能 , l4 s! b% w; Q# Y( _) k, x$ Zdnbinom(x, size, prob, mu, log = FALSE) 概率密度" d/ a+ m" }7 B9 X0 E; c2 L
pnbinom(q, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 累计密度 3 n2 q! t: B U. }* X+ w; I# Gqnbinom (p, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 分位数" h9 ]% p3 o6 A
rnbinom(n, size, prob, mu) 随机数 5 c" X* Z) H& u9 M3 Q2 \负二项分布的递推公式如下:6 ' B5 J" W& p9 S ! b9 t3 v+ S. r, p 6 A! V. p; _+ V) l8 Y" U& m, ]( e6 e" c' X) p
' j- r0 u; f7 @7 L2 ^ , i$ y/ b4 o; e$ u& {! U' Z 0 | ?; y# F! Z. [' K8 E * u" D0 ]' _6 |2 u* w7 I : p* Y5 x" \& e- r9 B- R1 J3、帕斯卡分布; Z% n+ f' e* N
X XX服从r , θ r,\thetar,θ的负二项分布,Y YY服从r , θ r,\thetar,θ的帕斯卡分布。有Y = X + r Y = X +rY=X+r。即:在同样的实验中,帕斯卡分布是成功r rr次后实验(成功+失败)的次数,负二项分布是成功r rr次后失败的次数。负二项分布的数字特征推到见博文1。故帕斯卡分布的数字特征可以由负二项分布推出。5 U, F4 S, g: s- P# ~
在R语言中我们仍可以使用下面负二项分布的函数做适当调整生成帕斯卡分布。& [! |+ ^0 }" C; Z- ^' p
注:在百度百科7中还有另一种说法是:/ q& ]: C% M9 e; N: j
% s: F& v: b6 z' @1 o3 o+ q# k* \7 l
5 D8 C' e0 J D1 u# [9 D帕斯卡分布,负二项分布的正整数形式,描述第n次成功发生在第x次的概率。 & r& @6 b; O# C1 C& ]3 _- N' T0 o' X( X/ ~2 V: }' d' y0 h
/ p4 q: i. ~# z0 M6 X R
我们在课本中见的比较多的是负二项分布的整数形式,这时候课本会标注又称帕斯卡分布,类似于二项分布,负二项分布也可以推广到实数上去定义。大家感兴趣有的可以去自己找资料文献考察一下,这里就不过多的讨论其定义和数字特征的问题了。 % ^4 m& X2 F7 E& S7 u) ~4 z- D5 Z- |$ K/ S2 ?, ]. u; v
7 r8 z6 h- Y P* |
函数 功能6 ~3 X8 j* f6 E$ u$ G% d8 a
dnbinom(x, size, prob, mu, log = FALSE) 概率密度 8 ^& m( K* ~7 I) G: ?' R! cpnbinom(q, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 累计密度 5 D3 X! H4 ?: K$ v6 W+ G) Pqnbinom (p, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 分位数 $ F# [4 _0 ~9 I* ~, I7 b+ s. yrnbinom(n, size, prob, mu) 随机数+ o8 Y, Y( X. q; D8 K. A
4、泊松分布 % A% G) ^( L& u0 X: _$ R– 矩母函数:M ( t ) = e λ ( e t − 1 ) M(t) = e^{\lambda(e^t-1)}M(t)=e 0 D, s) _# N) J0 qλ(e 8 E1 C$ P" R F% l
t ! V7 {% i: }9 e3 D$ |- }" h −1) ' ]3 I$ c* G; D' _+ a7 U7 C ; i3 `; k. G( [' L/ a! J) V
S `: j" i4 q2 h! O
6 |' c6 r8 G! |– 偏度:S k e w ( X ) = λ 3 + 3 λ 2 + λ ( λ 2 + λ ) 3 / 2 Skew(X) = \frac{\lambda^3+3\lambda^2+\lambda}{(\lambda^2+\lambda)^{3/2}}Skew(X)= % o; a5 d* I# E4 r8 y/ G7 {! L
(λ & `7 _" A+ P: v# X, w+ \5 x) v22 J/ ]5 E; Q. Z) _ R( P
+λ) & |) H9 t6 q. f* \8 ]4 B6 ^
3/2 / G6 t' n! g! c& V2 C( D " u- s4 y- R9 q
λ # t/ l. Q' S) M3 + e- [& { [% |" `0 L0 {. m* I1 h Z +3λ : Y& V# o, _' N2, K0 O) ^) D/ r/ n' E
+λ: A+ d- k* s3 [% S
& N8 ~7 J8 m9 N1 |% S 0 j0 I# b) J; s 3 a1 t6 L) c( o & b @8 I J. p3 a9 G& B3 l– 峰度:k u r t ( X ) = λ 3 + 6 λ 2 + 7 λ + 1 λ ( λ + 1 ) 2 kurt(X) = \frac{\lambda^3+6\lambda^2+7\lambda+1}{\lambda(\lambda+1)^2}kurt(X)= . ^, X3 D5 S3 T0 C# T' v
λ(λ+1) . i( M+ e: ]; h8 ^* k
2 0 y* v. Q9 t4 c5 t 1 U* z* U2 n4 n' \λ ' l0 {; g/ _3 D3 n
3 [- P' _; r* K; `9 C) o4 W
+6λ 5 u. O3 ^, ]8 t! s5 `5 i26 @$ W% k% F& R7 L8 K2 `' H1 U4 x
+7λ+1 2 Z: B& n1 z; g4 {$ |- y5 }1 G & M7 z l0 z" X1 v1 n3 w ( p' K" p4 Y. }! Y u
# Y; Q7 s4 `5 Q9 T- F8 M
& o% g2 `' D" ^0 T+ B' i8 ]/ K, F函数 功能. s# [* @1 U- {0 B$ I
dpois(x, lambda, log = FALSE) 概率密度, ? M) V, D* N6 ?% u7 C# H7 d
ppois(q, lambda, lower.tail = TRUE, log.p = FALSE) 累计密度 2 n% X+ d. h2 H. L4 ^qpois(p, lambda, lower.tail = TRUE, log.p = FALSE) 分位数 " k! a: ^/ x/ D6 {# b% V! m) urpois(n, lambda) 随机数 " V- d/ K0 n6 w; Q* C& i1 x中心矩的递推公式来自8:5 I9 F' e. C1 }; V# r/ K! g
; {9 F" O8 b' F- s) ^4 C" t% \7 o9 V' i! ]
. U0 e4 f0 d- l. K) W T& t4 N" {& H- x9 @. ^# l5 H/ ?, y
5、 参考链接: z4 W. j7 S+ n% I' y$ S
https://blog.csdn.net/weixin_46111814/article/details/105243202 ↩︎ ↩︎ # G9 I+ g" @' B( y, G% b/ q6 R ; O) I( ~+ `. V- [2 r: \, n3 t 5 H @- j* N, l+ G' d6 Z. e' l% `https://blog.csdn.net/weixin_44602958/article/details/105261188 ↩︎ : ]" [- j( g2 I9 H2 O- Q8 u- z5 y5 G3 S x
. u2 r6 y2 J0 ^8 f( a* T; ^https://blog.csdn.net/STcyclone/article/details/84310450 ↩︎& C' o4 l" @& z% F8 [- \
$ c, K1 F; R9 e3 I/ @0 `7 w. ]" [8 i n: G2 B/ h" g! d1 P! @& a
https://baike.baidu.com/item/%E5%81%8F%E5%BA%A6 ↩︎ 7 T e' ~( E( L( s5 F8 r! `5 @* u2 G2 E, J6 O
9 k# w' p6 b. X
https://max.book118.com/html/2019/0412/6234220152002022.shtm ↩︎* h z6 N% }/ h) A+ |2 j& Q* v
$ p" ?8 ~/ b1 `% P$ o$ u( H y) |/ H! M
朱成莲.关于负二项分布高阶矩的教学注记[J].高教学刊,2017,No.66,103-104+107. ↩︎ B( Z8 k% \: z1 f0 a) z r( ^9 O" s5 v& w/ m, y+ N
0 Q. o; [; Q0 F. f; k
https://baike.baidu.com/item/%E5%B8%95%E6%96%AF%E5%8D%A1%E5%88%86%E5%B8%83/1188907 ↩︎ 1 w6 a( E; q5 T2 |2 N& d5 ?# F% t$ l+ o6 ]% F
' `; X3 \' w2 Y) R& z" P
https://wenku.baidu.com/view/7f8328c10c22590102029d83.html ↩︎ 4 x7 ]3 o1 d( K————————————————: _# r/ d) Q; Z. `5 Y$ E |- G
版权声明:本文为CSDN博主「统计学小王子」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。; `+ i; f$ }. f; E5 l* Y$ v
原文链接:https://blog.csdn.net/weixin_46111814/article/details/115499487 ( r: _) R$ [6 h/ \5 p% w# o! l$ G ?" w) g" ^
1 X- `) {6 I% ?0 Z5 T/ q