- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 557405 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 172594
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 18
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
( x: j" \# B- |离散函数的数字特征及其R语言的应用
* p4 X4 k) C% `3 Y& |0 }1 U% P6 Q目录: a7 z! Q* a# a) u! R: e
0引言
/ i) E6 [ ]* c本文结构- l! y0 Y9 }) p8 `" f9 W
理论公式5 k2 A0 M* [$ f% x2 b" F: r1 A
1、几何分布
; A1 o5 E3 B$ s$ ?) s* Z2、负二项分布
* L3 V7 H5 V- u Z6 |/ \) ^: I3、帕斯卡分布/ O8 S+ P+ X# z, ^2 B) w1 A' e
4、泊松分布) T2 |; r% }4 A& P P. i# Q8 }+ T. C
5、 参考链接- [: |+ r+ K! m5 s
0引言2 J( P# Q0 m3 `! o6 O8 i$ a2 l
本文结构1 V0 }9 B4 W. M H5 @$ ?
在文章统计学基础——负二项分布的数字特征1中介绍了负二项分布,在博客2中介绍了离散分布的数字特征。6 D& F- m8 ~4 y+ }
本文计算一些离散分布的:密度函数、分布函数、均值、方差、偏度、峰度、特征函数、矩母函数
8 |! G. r! W6 w9 |
: v; l% \+ m' R. y* ]; y8 X% C7 r8 K: l) B
理论公式% S) p7 t8 b$ s
为了方便先给出计算公式:" Y8 v6 T8 o, x6 u3 p5 e9 X
3 Z% X# D8 ~' t1 u% z8 ~/ j& G0 o9 H. L$ U# R- R! }
– 密度函数:f ( x ) f(x)f(x)
/ t' g8 r, z+ ^ h# J) Z6 e! d/ I, ]& Y. k; [
! @* [: ]- c5 o0 I5 L
– 分布函数:F ( x ) = ∫ − ∞ x f ( x ) d x F(x) = \int_{- \infty }^x f(x)dxF(x)=∫
+ ? W$ I1 Q( ^) K S- ~- \−∞
S' B0 k* Q/ Q: |1 T) |: _! Bx
" S0 H5 V/ q$ o6 \ ; G/ E! K" L# w9 w- _7 r6 J8 ?5 [
f(x)dx9 w8 M: X$ m6 r
5 t0 n, u$ [9 n; r6 f( H
4 \9 i- `) t3 s! j$ U0 G+ o5 J* X– 期望:E ( X ) = k 1 E(X) = k_{1}E(X)=k & G& i) p( T. W* Y
1
% R. l% v$ P. {* r
4 I* m" v8 F8 m/ S. p$ i0 }% {
1 Z- _7 R j- o' Y5 @7 D! o8 U8 R4 {* n
9 d7 j: g2 a% z9 f3 z– 方差:D ( X ) = k 2 − k 1 2 D(X) = k_{2}-k_{1}^2D(X)=k * c- Z* E# }0 K1 r. V, G& c) K; i
2
0 u: c! t) d5 w: C5 j, H" f * N4 w% @3 ^( W6 a
−k
6 A" J( \* x6 `3 J1 g% y18 N# o' x$ t9 t
2
; y2 u+ R1 i3 k% e" p K* a! i - y2 H4 z& m: a5 _; Z. y
3 w( y/ c3 u/ e* w+ F# K
; I# v* b: O9 w- \% O9 L, [) a: c7 K0 F& }
– 特征函数:φ ( t ) = E ( e i t X ) \varphi(t) = E(e^{itX})φ(t)=E(e 9 {7 z) q% Q/ ^" \4 ]/ d& Z
itX
@) r) }& J# o" F3 }+ t% @; w- g ), i! W7 O" ^9 ^3 i8 g0 [
' v6 ?" {8 ^2 Q: y% O3 C3 g
+ z/ S' [. S1 \+ M4 z0 _# s$ F
– 矩母函数:M ( t ) = E ( e t X ) M(t) = E(e^{tX})M(t)=E(e , U0 [% V2 \. g: V
tX
8 G& @1 O$ e' Q Y9 X )! c9 I. s" [) W
% w. n! ~* I. }2 n) S
4 I: i# n3 z! I {) B% o
– 中心矩的关系:E ( X k ) = i − k φ ( k ) ( 0 ) = M ( k ) ( 0 ) E(X^k) = i^{-k}\varphi^{(k)}(0) = M^{(k)}(0)E(X
7 a& x) A3 N. ek
3 X$ g4 O, X ?7 {$ @. [; ? )=i ' Y" Y9 I$ M+ C8 J
−k
; H# g8 U' ^3 ^% W. I φ
* ?3 ^' G4 i$ l3 D1 H1 I(k)
, J4 g. F7 o$ I& z$ U& _ (0)=M
# l8 H' k1 |% A1 M8 q( y4 I% P# B(k)
$ Y2 y1 w2 ]2 j& F (0)" p% F5 M4 ?) u) w
3 _* B( J4 M% W, y7 w3 l5 D% z0 V( I
8 D2 s) H# x1 u1 S9 u0 {
– 偏度:S k e w ( X ) = k 3 k 2 3 / 2 Skew(X) = \frac{k_{3}}{k_{2}^{3/2}}Skew(X)=
8 {/ F' V% ?6 I3 F9 H; r$ dk ; D+ c# N+ J; k3 |1 F' F
2
7 E" {+ }% ~6 T0 h" G# |# z9 \3/2
: l# k2 f8 v' T4 z $ ~; k% f6 Z( t' f1 w
+ B; O; J# X7 ~" R. H& G9 z2 n+ {
k 9 J; |- J3 h+ M' N; i/ S/ L8 {
3+ _* A" |! T: U! t
& l0 u5 M: d. ]+ h, H9 ` - n/ K# o- ?) Y
& Q, C ` F+ z 3$ }! v+ X) E7 e. f, x2 z2 ~
# j" I9 {% q/ D' d
* N9 u/ E- r8 ]7 q6 }
– 峰度:k u r t ( X ) = k 4 k 2 2 kurt(X) = \frac{k_{4}}{k_{2}^{2}}kurt(X)= ( O; }, Q- R& j8 @. G7 S' ]8 u
k
1 S) t6 S3 V% e4 c' O" G# E' L2
4 ~" R s8 U+ L1 l: P6 w2 X" L2
* k& @3 w* t& C; _) Q
! I+ _* y2 \) A/ }! }
1 I* C/ l( b* W2 K9 mk
$ Z0 ]& |+ W7 u* i$ _) }+ F# Z8 m# L) T4- m y1 z1 `- `6 X$ f' e" z
- {' D$ ]6 p4 ] B
2 \) h0 s- j- ]* h9 ? ' g1 i) g2 h0 C* Z% E
4
) y9 _; [( z$ i4 M( h; c8 V/ ]& c/ w6 a/ }9 }
0 U2 R# ]- X* p
1、几何分布
, P# i3 [ z" h; d– 密度函数:f ( x ) = ( 1 − p ) ( x − 1 ) p , f(x) = (1-p)^{(x-1)}p,f(x)=(1−p) , u0 A+ @' B4 K) Z8 C! k& t
(x−1)5 e# m9 m/ u/ a: k2 U# C) R
p, x = 1 , 2 , 3 , . . . . . . x = 1,2,3, ... ...x=1,2,3,......
" N/ w" { j X' [, Q3 k. v" s0 K# W9 E6 k
. m% _% s* J- E5 g% }( d7 {3 p4 p– 分布函数:F ( x ) = ∑ k = 1 x f ( k ) = 1 − ( 1 − p ) x F(x) = \sum_{k=1}^x f(k) = 1 - (1-p)^xF(x)=∑ ' G) f! _& x* h" k
k=1
0 o( t* y% f$ g( j Ex$ I _) M6 S# _+ ?) s }) R! e
! X' F; U2 |: s, ^9 a3 X# |3 W& c f(k)=1−(1−p) 4 s1 S) [/ U9 Z+ l2 Z: h4 R% Q
x$ o8 M; u) i% }& O9 r
& t8 O& u( A' v* w: B& l% D) Q& v: x: ~8 B+ Z# \7 S8 }
; N; `* ]% \3 M
– 期望:E ( X ) = ∑ k = 1 x k f ( k ) = 1 p E(X) = \sum_{k=1}^x kf(k) = \frac{1}{p}E(X)=∑
! K6 z- m6 B# F" O4 Wk=1
$ A7 ?0 L! L! L( Ex
5 [3 g( O! }' ? ' i6 z0 \) `6 p% [2 g& P
kf(k)= 8 b0 M% j. a$ K. {
p
( _" x7 C d6 |/ C$ H17 G! \0 k; o j I, T ?5 _! V
- ]6 u7 A9 }% q( q4 k6 R/ D
( k4 S: I/ ~3 V/ n
, m* A7 \( K: Y1 A5 M& b1 s, j3 n, o
2 c% Y: Y7 o& ]– 方差:D ( X ) = ∑ k = 1 x k 2 f ( k ) − E ( X ) 2 = 1 − p p 2 D(X) = \sum_{k=1}^x k^2f(k) -E(X)^2= \frac{1-p}{p^2}D(X)=∑
w! S, D8 [+ V( {$ \k=12 e& Q7 ~% E9 }) f& }( e2 ^) @
x5 X) u+ \; f8 W: N
6 R6 x0 w; {7 d# e
k
% B: y/ Z2 I, q5 A$ u# g- w$ W2. |- G: k1 C4 U# W% S
f(k)−E(X)
3 {: z0 u+ V: I3 F& f26 V1 B" V( G+ f e8 r/ \7 C1 H
=
, q& z* ^3 q! j5 @6 C [5 V4 Y) Tp 9 v! A5 G+ |- e# G
2
, p( a i1 k* { J$ a* T ' }1 L7 z- B5 B
1−p* S2 L6 p. L% X. X/ G3 m1 [
- Q( ~$ _5 V, s# Q+ E( m
+ [1 ]& @3 _6 ^0 L0 l& V3 E* d1 O) {6 v V) X1 P6 h& A- G- x
/ ~' L+ s& q4 X! ]/ Y- s– 矩母函数:M ( t ) = p e i t 1 − ( 1 − p ) e i t M(t) = \frac{pe^{it}}{1-(1-p)e^{it}}M(t)=
9 j& z0 q) [3 e- C1 S8 m6 N+ E1−(1−p)e 6 k, D- X) B; K) [
it
# z& u H, P% f! e1 X% O
: b% D# I9 Q. G4 w8 Lpe
$ n* v' Y0 U3 m' fit0 k0 @) A4 s2 k5 ~# K: f- T
# H4 H' t7 L, I9 b( I
6 e: d1 _* Z' j0 P* r . i$ ^! p* [' }* p8 P0 n8 S
2 A5 ^7 E+ C/ _4 \$ R/ o
& w8 c. H/ l0 G) y% h* { D, S& c– 偏度:S k e w ( X ) = 2 ( 1 − p ) 1 / 2 Skew(X) = 2(1-p)^{1/2}Skew(X)=2(1−p)
4 a f- c3 O0 P2 H p4 C+ D# e) M1/23 f6 [* u+ b3 h% P/ T
! k3 X# g; M$ y
3 \& K w4 \; n/ z z+ s1 B+ f+ P, i2 I1 ~* b
– 峰度:k u r t ( X ) = 9 − 6 p kurt(X) = 9-6pkurt(X)=9−6p9 @" F4 ]5 V* `* \
& }; e' Q/ I: I
y: r4 A& b% o- b函数 功能" q3 O7 @' R" D3 D8 Q- \
dgeom(x, prob, log = FALSE) 概率密度
- x8 G. L0 o9 z" A/ Rpgeom(q, prob, lower.tail = TRUE, log.p = FALSE) 累计密度9 p* M% z; q# Q U3 ]; q
qgeom(p, prob, lower.tail = TRUE, log.p = FALSE) 分位数
& u: N* x) R9 A% D/ R5 }; {0 Nrgeom(n, prob) 随机数+ I: I8 M5 P! v) ~, o# {
几何分布的各中心距来自5:, E [. ]! J! L# j" O- |5 g
9 C9 X1 `# D0 h# P- T. r0 [/ Y! L, V4 L& e; r
$ u$ u7 b, A: {% {: D" u: l: m ~: z! [& n- ?" K* a9 k2 f
2、负二项分布
& S5 H' n |7 j& T, \– 矩母函数:M ( t ) = ( 1 − p ) r ( 1 − p e t ) − r M(t) = (1-p)^r(1-pe^t)^{-r}M(t)=(1−p)
- N+ V' U5 K1 f- C: xr
. V4 M4 D! v- {9 P (1−pe ; H, r3 [0 J- u ~. }: u) h8 [/ d! H
t/ k& w% y% u; P8 v M6 t
) " V7 O7 _( e5 m+ ~
−r
; g0 W1 n9 O* b0 u6 P1 `
! U5 v' b2 ^8 _+ \5 N* `) U ?3 y" @+ g4 s
! p" C8 y, r" T- V* L g* n O" Q
– 偏度:S k e w ( X ) = n 3 + 3 n 2 + 2 n − ( 3 n 2 + 3 n ) p + n p 2 ( n 2 + n ( 1 − p ) ) 3 / 2 Skew(X) = \frac{n^3+3n^2+2n-(3n^2+3n)p+np^2}{(n^2+n(1-p))^{3/2}}Skew(X)= " p7 X4 ~* W; Z. [, C
(n
% }5 S- ]" V; v7 Q8 J20 V! S4 n( T1 g2 J+ \6 D
+n(1−p)) ( A8 f. r0 F/ @! q# h5 n' ]1 c
3/2
' v8 V8 x) r; L) B; C% b K % f. z7 j2 q$ v% m# z& b
n
0 Z' ~; n6 V& t; M r3
0 u% l3 Z& W0 t+ g; z5 ] +3n
: h7 z7 f7 k7 F) ^" Q9 s2
2 T- x0 v. [) t& m; F. F, M! V& K7 G +2n−(3n $ @* ~* f( A" I
2
7 k- c% v) F& Z Y% c/ [ +3n)p+np ! Q* _, v) I* r7 Y$ R
2
* k0 W; _1 M9 R n* C: d) w " W! g& O7 y% q, D5 [; }; m" v2 c
8 S/ N' p& {7 ^; T' g4 J; L
, K6 s1 x! H' u% z" H9 k- T+ [/ P8 r4 s ]6 H" |
% L& u4 M* G) P7 s( h1 J4 h' d– 峰度:k u r t ( X ) = 略 kurt(X) = 略kurt(X)=略 (带入递推公式自行运算)
5 ^' t2 n1 B% b5 `/ P; J5 l2 [' f
' w+ b, K9 c7 B8 p9 v/ D函数 功能' t' k$ {. [( d; @ d2 Q0 Y" |
dnbinom(x, size, prob, mu, log = FALSE) 概率密度
' Q/ n2 {* w" @5 t; A/ G& {# { Ppnbinom(q, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 累计密度2 m( ?5 h8 j! [5 @# @
qnbinom (p, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 分位数
4 v& K' b; |: e* g& grnbinom(n, size, prob, mu) 随机数
3 z. I) @! Z- T8 ], h/ w: S负二项分布的递推公式如下:6) ^6 O8 O9 @6 i) d- F
. h- H- I2 ]& S S$ d9 a6 G9 F$ A% `: H7 Q0 i- I& B
6 [. v1 ?. k6 p# Y
p3 [. y g7 b& H$ @
/ m- t( c: T8 F- E9 R
( J K" c/ w- @
9 @ A* X8 A/ D+ m, S3 \
2 I2 b! q# w0 p7 F2 r% Y1 ~3、帕斯卡分布
: v& B. j( B0 {8 T( x6 lX XX服从r , θ r,\thetar,θ的负二项分布,Y YY服从r , θ r,\thetar,θ的帕斯卡分布。有Y = X + r Y = X +rY=X+r。即:在同样的实验中,帕斯卡分布是成功r rr次后实验(成功+失败)的次数,负二项分布是成功r rr次后失败的次数。负二项分布的数字特征推到见博文1。故帕斯卡分布的数字特征可以由负二项分布推出。0 N* o7 f3 O) b& [% V
在R语言中我们仍可以使用下面负二项分布的函数做适当调整生成帕斯卡分布。
7 V* W0 y# }0 R5 [注:在百度百科7中还有另一种说法是:
7 |5 ]# U. g9 C; T0 |- A$ l; z8 U( S C
8 E5 y& x7 y- u( E. H
帕斯卡分布,负二项分布的正整数形式,描述第n次成功发生在第x次的概率。3 B L; l( w) _
/ X- S2 k7 o0 R7 b, m
! s3 c9 p5 |8 C- L. R3 |/ I4 K
我们在课本中见的比较多的是负二项分布的整数形式,这时候课本会标注又称帕斯卡分布,类似于二项分布,负二项分布也可以推广到实数上去定义。大家感兴趣有的可以去自己找资料文献考察一下,这里就不过多的讨论其定义和数字特征的问题了。' ]- N5 D C. q& a
' u6 f6 _, U0 \! C- f
. U5 L- ^( H2 t! e函数 功能9 i- w6 y" T* i& D% J% Y
dnbinom(x, size, prob, mu, log = FALSE) 概率密度6 H" v( E4 Q! p4 o4 C
pnbinom(q, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 累计密度
! w) f# T& J2 {. S& vqnbinom (p, size, prob, mu, lower.tail = TRUE, log.p = FALSE) 分位数
8 F% F! I/ m U. L# Drnbinom(n, size, prob, mu) 随机数
" i& s$ _3 ^) Z4、泊松分布9 F! |( _9 _. N6 e3 i" m
– 矩母函数:M ( t ) = e λ ( e t − 1 ) M(t) = e^{\lambda(e^t-1)}M(t)=e 3 ]* |, e/ m/ Y; j( @
λ(e 2 r5 p: J+ c/ h6 T5 z2 J
t
) e3 q6 P& W, E( [7 I7 }% A −1)
9 \4 n$ w* M5 `8 w6 Y - v6 `" Z5 P4 v9 [
" T0 X+ s* u, C
7 x4 |( ~; _! V1 M7 C G0 D
– 偏度:S k e w ( X ) = λ 3 + 3 λ 2 + λ ( λ 2 + λ ) 3 / 2 Skew(X) = \frac{\lambda^3+3\lambda^2+\lambda}{(\lambda^2+\lambda)^{3/2}}Skew(X)=
* L, l4 i' N$ M1 n(λ
- _6 S- _% D2 L& o( ?24 M% t& i& I G9 V/ i& Q' c
+λ)
( G. \' @/ M7 [- j! ]- h3/2
; U) z' S( K7 q6 ~& U" A* M
4 p, T% y$ {& bλ 1 o! |; j! g0 ]. U
3
) f: T; {; c% N- r# d6 G +3λ 1 @5 E& {. y) H2 [0 U
2( O3 @ A- U0 z* Q. f
+λ8 {) \ }% _# ` X) u0 \1 m
- q; y( V6 O( U5 N$ N# }
# y' `# k; i$ d& g. Q, }
2 D' A9 _! i0 H8 H! e( E
% [/ ]" \ a+ |2 q; n% g+ R– 峰度:k u r t ( X ) = λ 3 + 6 λ 2 + 7 λ + 1 λ ( λ + 1 ) 2 kurt(X) = \frac{\lambda^3+6\lambda^2+7\lambda+1}{\lambda(\lambda+1)^2}kurt(X)= ( C, s& y0 t% |
λ(λ+1)
7 u7 {1 t U) P6 d8 r- i: @' V2
& u% k7 | d& l
/ S6 x: K/ j- Aλ 4 u6 X3 o. U) n# T: j
3* n5 O2 o2 c# z$ |+ t
+6λ
$ v9 k! c% C5 z5 E. F2
9 N3 e& v4 ? E6 \6 d0 } +7λ+1
5 D" ?6 G% K" u: \
. A+ H1 o' {$ [5 c% m : z {9 }6 K( v5 o
8 K7 t& L* D3 B# A( C& c- h9 e
1 ?, X' q( y. C8 }% H- A
函数 功能 I S9 y( f! n; u$ X4 K R
dpois(x, lambda, log = FALSE) 概率密度7 G0 W/ q2 }& Y* W& M# C
ppois(q, lambda, lower.tail = TRUE, log.p = FALSE) 累计密度9 r1 f: E- h1 n7 }
qpois(p, lambda, lower.tail = TRUE, log.p = FALSE) 分位数9 d8 H& i7 R( \; }
rpois(n, lambda) 随机数
! [9 n Q% w" L. G+ g中心矩的递推公式来自8:
! e& S) e `' c' k4 z J3 Z& y+ V" e- q# u# o9 i
" E& {3 K8 X0 P" A2 C3 t
5 a0 r$ z* G* G2 X. M" ]' f
/ x* O- ]- e7 {0 ?3 Q+ i5、 参考链接
; U6 G" {3 @7 ]+ i ]https://blog.csdn.net/weixin_46111814/article/details/105243202 ↩︎ ↩︎
5 O( F1 z$ ^+ M- J
: |& {5 R$ f2 v' X
+ w- G! Q x# }9 C7 B3 ~https://blog.csdn.net/weixin_44602958/article/details/105261188 ↩︎' f( M7 r, T7 M& X4 M% s8 H/ K
6 f4 H, _' N/ }& F. L9 ^/ z3 V3 B9 i0 t
https://blog.csdn.net/STcyclone/article/details/84310450 ↩︎
1 c$ I, J) E+ u/ g2 X- \
! Y% e+ `% s! _; X# Q- g- y3 g. N6 U _ }
https://baike.baidu.com/item/%E5%81%8F%E5%BA%A6 ↩︎
+ d: ]6 a8 m/ `4 Y
' r+ k1 n3 Q. B( a5 {* Z+ j, M. \
https://max.book118.com/html/2019/0412/6234220152002022.shtm ↩︎
! Y& u3 v; a5 R. h( V( I( _1 O3 Y9 e) M1 L2 c% z
7 h2 |* J6 m9 d
朱成莲.关于负二项分布高阶矩的教学注记[J].高教学刊,2017,No.66,103-104+107. ↩︎
! [6 o9 @0 Q$ S
' V) U! m' E/ y/ R
2 T, h: q: J& f j6 |' U: Jhttps://baike.baidu.com/item/%E5%B8%95%E6%96%AF%E5%8D%A1%E5%88%86%E5%B8%83/1188907 ↩︎/ U% w& p- _$ Z, a5 i% Z8 E
" @3 d. c4 G0 I0 f# ^
9 C: ~4 K5 m4 ]+ E" Shttps://wenku.baidu.com/view/7f8328c10c22590102029d83.html ↩︎
. C+ u7 Y% p& z, Z! r! i- w+ m8 [————————————————
; r* M* U! n8 x版权声明:本文为CSDN博主「统计学小王子」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
$ I8 X! q$ R: n! p1 C原文链接:https://blog.csdn.net/weixin_46111814/article/details/115499487% @! R# V3 e' d, G R
# _) U. Q5 T; _' s( @5 V# j! @
! C& v# N5 `/ c. V- u) j7 R, ?' V |
zan
|