|
什么是传染病动力学?numpy和matplotlib用python实现传染病模型SI模型SIS模型SIR模型SEIR模型 什么是传染病动力学?最近,在报道疫情的众多新闻中,相信大家也看到过一些来预测新型冠状病毒会导致感染肺炎的人数。你一定好奇,这个人数要怎么预测呢?预测人数又有什么用呢? 事实上,从学科方向来说,这类研究属于传染病动力学,就是用数学模型去描述传染病在人群中传播的规律,从而预测患病人数,进而指导政府制定措施和政策去控制传染病的传播。6 i* A+ R$ s6 k
这类研究最早可追溯到18世纪Daniel Bernoulli对天花的研究,而我们今天所要介绍的SIR模型是1927年Kermack与McKendrick在为了研究伦敦黑死病而提出的,是传染病动力学中最基础的模型。 介绍了传染病模型的背景信息,不知道现在你对传染病模型更有兴趣,还是执着地对python更有兴趣呢?不论哪种,这篇文章会满足你所有的好奇心。 numpy和matplotlib首先,安装一下这节课我们需要使用的两个python包,numpy和matplotlib。4 v* O# ?3 N4 g9 j1 r! x
numpy-是python进行科学和矩阵运算最常用的包。 用numpy建立一维数组,存储和计算每天传染病人数的数据。 . p! m, T" ?7 A2 M& u5 C
import numpy as np import matplotlib.pyplot as plt 用matplotlib绘制传染病人数随天数变化的曲线,给出模型预测人数变化的直观认识。 好啦,下面开始用python实现传染病模型吧。 用python实现传染病模型为了让大家能够更好地理解,我们先不直接说SIR模型,我们从最简单的开始。 SI模型首先想象这样一个场景,一个城市有 个人,假设没有人出生和死亡,忽然有一天有 个人感染了病毒成为了患者,如果每天每个患者能够有效传染 个人,那么第二天患病人数是多少呢?最简单的答案是: ,也就是说每天都会新增 个患者。那这样以来,在无限远的将来会有无穷多的人被感染,显然这是不合理的,那错在哪里?仔细思考,你一定发现了,已经患病的人就不能再被传染了,所以我们有必要把人群分为两类,易感者(S-susceptiable)和感染者(I-infective)(你猜的没错,这就是SIR中S和I的含义,R的含义之后介绍再讲)。为了之后方便计算我们记易感者和感染者在人群中的比例为 ,那么 。我们重新考虑上面的问题,顺便来个示意图: Image Name这样的话,每天新增的患者数为 ,也就是总传染人数乘以易感者所占的人群比例。( m8 x/ A; y5 m! k8 s5 `3 U- j8 }
那么每天的感染者比例的增加量就是 。我们假设城市有一千万(N=10的7次方)人,每个患者每天接触感染每天0.8人(lamda=0.8),初始感染人数为45人(i0 = 45/N),我们来模拟70天(T=70)的情况。 # population
8 k; b3 S: `/ q, C" n! bN = 1e7" [/ I$ X. X, J5 N- I; o2 `: w( x2 {
# simuation Time / Day
/ B1 U" d# Z2 e$ vT = 70' g6 M) I K5 V' T
# susceptiable ratio" _/ N5 }9 o ~% v- K( q
s = np.zeros([T]); K* f8 L6 L" `& Q8 d- p- Y
# infective ratio
# }! i% q1 r2 U' r0 `$ p" oi = np.zeros([T])
+ {7 q* R" Q' S7 c0 m: K9 h# contact rate
: I/ B3 q, m6 wlamda = 0.8( e3 Z2 e x0 C- q3 C& c, W9 l. C. v
4 Y/ \ J6 c. O1 }0 c
# initial infective people6 m5 Q+ q7 u, [+ q2 ^( t
i[0] = 45.0 / N
, Z2 C# B& @2 S: ?* p
+ e$ G( a9 O( b% Ifor t in range(T-1):! `# D2 f3 F; V4 l, W' H
i[t + 1] = i[t] + i[t] * lamda * (1.0 - i[t])2 o$ K, e# r* `& b* d! L
9 P: c4 ~( ?5 [4 ]8 V
$ G$ l, {" Z7 z
8 v5 g3 _, n' l
相信其他语句大家都明白,新知识是这两行:
$ N5 {1 D8 x$ q$ Q) p/ q
& h( z; e9 h e$ G2 j* @- D( c- d) w: V6 Y R* p. B9 T
s = np.zeros([T])
8 b3 c4 D: b# B# ti = np.zeros([T])
5 h, I) Y# S( d$ M0 x) A3 V) Q2 d* k$ D
这两句话的意思是一样的,就是利用numpy(已被我们重新命名为np)的函数(zeros())来建立一个所有元素都是零的数组,而给的参数决定了这个数组的维度。比如:
, R8 L/ K- ^' d' F; R' M9 b# p7 c8 Q
a = np.zeros([2,3])
& |% C( [6 w. `) k) j7 za2 n Q. J; u9 O4 ?) U. C
' n9 I- k5 k$ Z1 E( V$ G5 q$ w
array([[0., 0., 0.],: x6 Q) u9 Q4 K7 z: R: s
[0., 0., 0.]])
$ T3 Q% g: }3 e0 j- U- Y* R& o# ~1 Z. N, O: k
1 K8 P7 V1 L6 W, a' S0 ]) i u3 z9 D
array([0., 0., 0., 0., 0.])
# A2 x1 V8 T0 h" e, }, Y0 x# W/ }7 D9 Y; D |2 x- D6 C
- o8 F) c# d. e* z/ z类似的还有产生元素全部是1的数组的函数np.ones():
" b1 u# r: H# h1 O' @$ I& f8 z! A, A1 M9 c+ V8 u; T
a = np.ones([5])
' W/ ]3 t; A8 h+ ia; I; G( Z) l5 ~7 l9 u* R+ U* s1 b
& s( i. b% \0 T) barray([1., 1., 1., 1., 1.])
Q4 q/ u a) h. ?! Q I
2 a: W: O- ^, u! M: p$ D2 N' k* ?1 A P
a = np.ones([2,3])
) c9 z1 i, m, C/ O: k& G6 `1 v8 S2 Va
8 x, K7 y+ q8 ?) f2 H% ?+ D; ?0 o# _" Y8 X) X5 Y9 C
, i! x, |* e: x6 l+ h
array([[1., 1., 1.],7 d" o4 G2 {- E" h
[1., 1., 1.]]): r$ U4 f( p- S7 s- I& U
6 s+ S5 X+ ^. w( x( `9 W/ R) c6 w
plt.plot(i)
0 D3 d/ w' W. x& o0 [2 P+ A4 f g9 t3 S; s4 Q( T+ |( l
( i& }0 H8 K5 n/ g$ p, Y$ [
[<matplotlib.lines.Line2D at 0x7f0c2768d6d8>]# b4 _! }. Q( |6 b9 u0 P$ k
; H$ g. N1 y2 J' C) B) e- C3 a
2 e2 L4 }5 r: G5 l; T
- a& O- l2 `2 Y" }7 z
/ Z: x8 F. I% i, e( |4 X2 ?% Y( m8 Y
& F3 D1 V6 m$ Q1 H) v实现SI模型的核心代码是第三个cell的第11,12行:
$ h. o, e& _0 o2 `) i7 [- e$ \* t( c# d" ^: ?
for t in range(T-1):
+ H5 q$ R1 i8 K3 J5 d% { i[t + 1] = i[t] + i[t] * lamda * (1.0 - i[t])% M i1 }3 J5 E* V9 U8 f' a$ ~% p
& F- x% R' \& C1 s5 P& R; N
就是我们建立的数学模型,利用python的for循环语句累加迭代的方式把每天的增加量叠加到感染者比例上。 运行代码完成计算,我们利用matplotlib的pyplot来画出感染者的随天数的变化曲线:
a0 U/ e0 c9 L: U. _* V) nfig, ax = plt.subplots(figsize=(8,4))+ e. K" |# {* Z/ i+ g: D: `8 A. l: s
ax.plot(i, c='r', lw=2)
4 ~+ ^2 i* o/ O5 I2 R" `ax.set_xlabel('Day',fontsize=20)
' S- k, _7 J1 ]0 q X" Xax.set_ylabel('Infective Ratio', fontsize=20)& o7 `1 r! d; g. X
ax.grid(1)
! H& |. v( r3 Zplt.xticks(fontsize=20)
8 Z7 ~0 Q9 a- o+ S/ t8 {plt.yticks(fontsize=20); \( R5 W! w* q- I8 x g# d0 p* Z
# @/ [2 F! N+ Y H; B. l l2 `6 s K1 S3 F& Q
/ _ |$ t9 w s& s
2 w9 ~6 l9 @" ^( f
从这个结果看到,大约在25天左右,全部人群都会变成感染者,感染率 。/ T5 z8 _2 K `' _7 ~
在程序中我们假设每天每个患者传染0.8个人,你可以改变lamda的值,观察全部人群感染的天数的变化。- m0 R; C# L+ L9 h
认真思考你会知道,lamda的现实意义就是该城市的卫生水平,衡量的是消毒,隔离这些措施执行得怎么样。回到传染病模型,按照SI模型计算的结果,我们全人类都会患病,这好可怕!原因是我们忽略了一个很重要的因素,那就是我们有奋斗在一线的医护人员,我们会被治愈!所以SI模型只适合研究具有高传染风险又不能被治愈的病(比如HIV)。 但是对于其他病,我们是可以靠医疗和自身免疫系统康复的,那么紧接着的一个问题就是,被治愈后还会再被传染上嘛?根据这个问题的回答不同,我们有了两个不同的模型,SIR 和 SIS。现在可以揭晓,SIR的R的含义了,就是移出者(Removed),现实含义就是指被治愈后不会再被感染的人。而SIS表示治愈后仍然还是易感者。下面我们用python来分别实现这两个模型。 SIS模型为了实现这个模型,我们需要引入新的一个参数,治愈率 。好啦,先上我们的新示意图: Image Name和SI模型做比较,区别就是计算感染者的增加数时要减去被治愈的人数。
! K) ^6 p& I9 ^所以这时候每天的增加的感染者为: ,
& {9 ^' O" W: d. f4 ^0 e0 B增加的感染率为: 。
. s* t8 D) Z7 g3 |( ~模型完成啦,修改python代码:! l" E' E. V* l5 t
# susceptiable ratio
- n) n4 a) R5 W7 f9 f3 os = np.zeros([T])
3 d9 V! V9 V% k% S% t# infective ratio$ z3 H. i7 E' x# C$ a4 a) t
i = np.zeros([T]) x! x4 z. c6 \/ u7 ^
" c% I5 p0 E9 |6 Z4 o: g, i( J4 [
# contact rate
! K& f: o1 L2 Q! A) olamda = 1.0; d' R/ ]$ x i. O
# recover rate
6 H( i" l/ K7 ^6 Kgamma = 0.5 7 ]3 C- U8 V1 k, E# N2 a1 X
5 k1 ]2 i1 o/ h& l
# initial infective people
' x8 H: {- L3 li[0] = 45.0 / N
2 V% m! ^& W7 ]- B: X) w
* t' T4 l7 `" @+ U, }( Nfor t in range(T-1):
( l( a. m: [' ]2 m i[t + 1] = i[t] + i[t] * lamda * (1.0 - i[t]) - gamma*i[t]8 f. K& y6 D. e7 I E& S3 K# z
+ k( a6 W8 F, h9 ^; y( b3 g4 m% ~2 w" P& Y
* [4 _$ U+ _" Q: Y! z# e9 C运行代码,我们画出曲线(代码和SI模型的画图完全一样):. y1 T6 J: s X% I' L( B
6 I& T; ~& V0 G0 @" n
fig, ax = plt.subplots(figsize=(8,4))
) d! v7 A, l0 k% n/ G& i- w/ M' Rax.plot(i, c='r', lw=2)
- W; t, a% Q6 W8 u* p Oax.set_xlabel('Day',fontsize=20)5 d' f% m+ j2 t+ @4 ~) c5 f! n" B
ax.set_ylabel('Infective Ratio', fontsize=20)% ?) F( K* U/ J5 D
ax.grid(1)$ S) \( U8 X, Z! y. D4 H
plt.xticks(fontsize=20); y @) f9 x6 g* x. [
plt.yticks(fontsize=20);' c4 p1 r, W% @
; \1 Y7 S8 t. g" t
% A- h+ H2 G( z4 X0 x) l
! W$ i/ `: K8 x5 z, u
, v7 X) W: b# M, ?# ^" O行代码,我们画出曲线(代码和SI模型的画图完全一样). F, m) R, A7 I: c0 R) f
可以看到,达到最大感染率的时间退后10天左右,最后感染和治愈达到动态平衡,人群中有始终有一半的人感染着。所以,SIS模型适合研究具有传染性和反复性的流行病,比如常见流感。同样的,感兴趣的话,改变lamda和gamma的值,观察曲线的变化。和lamda不同的是,gamma的现实意义就是对这种疾病的治疗水平。 SIR模型加入了移出者,被治愈的病人不会再被传染,先上我们的新示意图: Image NameSIR 模型! i( |( u5 z* R/ i
注意到这里,人群被分成了三类,不再只有I和S,所以相比于之前的模型,我们需要找到新的约束关系。现在我们需要分别计算三种人每天的增加量了: 3 |0 k% K* B+ u, A0 h+ m+ g
- 易感者:每天都在被传染,所以一直在减少,减少量为被传染的人数:
- 感染者:增加了被感染的人,减少了治愈的人:
- 移出者:增加了治愈的人:
4 w' `' H: O# z, p$ u7 k! v& y
建模完成,修改python代码,并且假设人群普遍易感,新型疾病,初始没有移出者。
- Y& R2 C1 @, u6 p' `4 h: U2 d' ^# population
- A# U6 o' v( F; f6 d# KN = 1e7 + 10 + 54 _, m3 W9 D: `8 R. I
# simuation Time / Day1 c* ?- l+ M( P3 U
T = 170! X" o! U- J( b' @, {
# susceptiable ratio
# Y+ G$ @9 u$ q" h1 N5 Js = np.zeros([T])4 s" y3 P1 k8 e/ f" f3 ]0 c' d
# infective ratio$ s) c4 T/ U( l3 O
i = np.zeros([T])2 ]# J, C! B6 M
# remove ratio
# h6 y( j: Y( ~ G" ]. Y. _r = np.zeros([T])3 C& \5 u. I& m+ ], f1 u6 [
& {# \: E! `7 d2 S# contact rate
$ i5 ?, {- Z& ]2 Q% c% i2 J+ Elamda = 0.2586
0 J/ d, ~$ E0 Q8 I- L$ X( G- A# recover rate3 a: x1 ^2 c( x; W% ~! Z4 G% |
gamma = 0.0821
# c0 g; W! X+ @2 E0 Y a/ R" m
# initial infective people1 g' z' T& R3 x+ }
i[0] = 10.0 / N
: g6 F j. f5 _. C( m! fs[0] = 1e7 / N
8 I2 m' y& ?9 w& ?9 L! e3 P* P; T# @7 yfor t in range(T-1):
2 t( v4 B! A: g/ l% v, j' z i[t + 1] = i[t] + i[t] * lamda * s[t] - gamma*i[t]
, L+ l( b5 n4 M s[t + 1] = s[t] - lamda * s[t] * i[t]
* |& D/ T: i9 R* o& _& m$ q% Y r[t + 1] = r[t] + gamma*i[t]
- Z- L: }6 {( W0 M: [& u' E8 T! N, W5 v. l% [
fig, ax = plt.subplots(figsize=(10,6))2 q F8 w! y; y4 N; Y6 g! _
ax.plot(s, c='b', lw=2, label='S')/ T" M I/ V" _) B9 {
ax.plot(i, c='r', lw=2, label='I')4 w0 C0 s9 n B4 x! N
ax.plot(r, c='g', lw=2, label='R')
( B- L: @% Z9 e7 N" t3 gax.set_xlabel('Day',fontsize=20)
8 g% {# k) w& Sax.set_ylabel('Infective Ratio', fontsize=20)
& ~* f3 n1 x7 Nax.grid(1)+ {9 L' `0 c( f
plt.xticks(fontsize=20)
* M: f- V! D" l6 F# l7 M' cplt.yticks(fontsize=20)5 \& @4 g6 |( Q$ S
plt.legend();, D' Y: l' U2 d0 K4 ]* J- M
1 y8 B1 @" O2 o6 @, d
" H* P8 y0 k- l: B9 ?( ^
7 h, b. h( l7 Z m9 V9 p
3 A: ] B9 N9 i& j感染人数峰值发生在一个月左右,最大感染人数不到人群的20%, 但是最终人群的80%都会得此病(就是最终的移出者的比例)。SIR模型适合研究没有潜伏期的急性传染病,治疗后能够痊愈并具有抗病性。 到这里,虽然不准确,我们也可以先用SIR模型来分析一下此次疫情,武汉新型冠状病毒的传染病动力学! 模型有了,其实就是确定参数的问题。一开始就有人做了这个工作: Image Name于教授给的参数是参考了非典的, ,初始易感人数为一千万, 初始感染10人,初始移出者5人,那么我们的城市总人数 , 带入我们的模型得到结果:重现于教授的模型
' a) p1 [5 T9 f高峰和尾声日期的推测基本相符。 ( o, G& R/ b& {( u& x8 P# |
# susceptiable ratio
, W! N& n B5 ~! r& _, K$ K$ ts = np.zeros([T])% z6 U+ ~4 m3 B, @, d0 u, F& y. h6 q
# infective ratio
7 D J' H& }+ ~$ x; X% K0 Wi = np.zeros([T])- Q; z& d3 X3 }' W- k$ y! Q6 ^
# removed ratio& w& v' _+ Z. v2 M l5 k
r = np.zeros([T])7 z2 I! ^, D- t: o
* t- u& W$ U$ ^% T
# birth ratio
$ f* [+ E" y6 \4 H ?b = 20.0 / N
% c' |, G# p6 f$ J2 T8 w# death ratio
6 ?& g( Q; \' z- t. X+ Ed = 10.0 / N
9 b: ] w) E4 I" W ^+ V4 U: G: L% y: }% w
# contact rate
. N% J' T' n; J5 Y5 x/ R4 L; b4 ~3 |y = 1.5, u, p, s6 k( N1 m
# recover rate- {) F' r9 C% P% p5 x2 l
u = 0.8 # 1 / infective_period
6 [+ x: C7 |- K0 q
4 V) X( n5 R z- f, f# sigma = y / u/ E6 l( [- d! K
7 b# Q# x' v# ]5 \8 X# initial infective people6 D' B) |' [! Y: F8 ^$ c# z, z
i[0] = 45.0 / N
- y1 n) Q: ^' J2 Xs[0] = 1 - i[0]- @2 Y" N( r; G. [; V- Y- x0 L" l
for t in range(T-1):3 J% \4 [ l! V4 f/ h
i[t+1] = i[t] + i[t] * y * s[t] - u*i[t] - d*i[t]
" T5 s% E( E* l4 @ ^7 S s[t+1] = s[t] - y * s[t] * i[t] + b - d*s[t]9 {+ a# B- r, H: e( ~
r[t+1] = r[t] + u*i[t] - d*r[t]2 Q s t7 K2 Y: L4 q% M
) u5 |" Q' U- U4 G e! y( Pplt.plot(i)
7 s! o- `, o& {: s Dplt.plot(s)! k, l+ u. z# c* V; ]* ]
plt.plot(r)
: h% t" m# N, F, q; bplt.plot(np.diff(i),ls='--')
3 L7 b* E0 k3 Q( r- I, _2 x& u$ v3 g2 B
- q3 u9 s# T% |! a; ^[<matplotlib.lines.Line2D at 0x7f77796e8518>]0 F. U' b" H* z
: z4 F! ?' w1 p% j- J1 J, Z5 M
![]()
; z7 f! D2 B; V9 @% u" P- {- c: n1 \6 [* y( \8 z% S
SEIR模型但是,SIR模型和实际情况的出入会比较大,因为忽略了太多因素了,比如说潜伏期,比如说政策调控,药物,出生死亡等等。下面我们可以和前面一样,把潜伏期考虑进去,新增一个人群,叫潜伏者E(exposed): Image NameSEIR模型
" q, o6 k' c) H2 S) O# y同样的我们需要计算各人群每天的增加量: S:每天减少:
7 v. b, [0 a) n# m$ rE:每天增加传染,减少发病:
$ V! w: P" K" [; ?; F$ y, R5 s% RI:每天增加发病,减少治愈:
6 K. B5 ?! ], K/ @4 _" N+ pR:每天增加治愈:
$ m; }( g% e6 D3 t建模完成,修改我们的python程序,这里的 可以理解为潜伏期的倒数。给的4天。新型冠状病毒给目前临床的潜伏期是3-14天。( L5 J$ d5 D) ]# c k
# population
$ x$ i) o+ L# B. gN = 1e7 + 10 + 5
+ Q: \" m* j0 D: j8 a: g# simuation Time / Day: }" R$ y. n/ D1 r1 A" e
T = 170
" ^/ _& P* E4 W( J& u# susceptiable ratio6 @7 E0 `( U3 W
s = np.zeros([T])" G; B# C: o, j3 B
# exposed ratio+ K$ [* o0 E. Y- i( V7 n
e = np.zeros([T])1 M* t% l4 _1 E2 Y
# infective ratio. Q6 a; `3 v) V. J. g( i
i = np.zeros([T])
, t! X- l3 {' g" Y7 Y, \% f# remove ratio
9 N+ T: L) U* u/ M& l* qr = np.zeros([T])0 S- J: ^) ?, ] R0 R
: @* {/ ^$ k$ q- ], [
# contact rate
+ n/ h! r* K0 \; L( Ilamda = 0.53 \ s, q9 }" @
# recover rate
9 @( j" l3 k4 L1 w# F, Y, c4 m& Egamma = 0.0821
" F3 Z* ~- q. U5 J2 d' N# exposed period
0 O, D; ~/ v$ n+ P9 M8 [sigma = 1 / 43 O4 K* y2 o7 P
* P8 ]+ y+ L% U! q
# initial infective people2 s/ z1 ^8 V, l$ P
i[0] = 10.0 / N/ B% }& p; w7 t- M1 f1 d. U b
s[0] = 1e7 / N" ]5 e. l) q; M; Q
e[0] = 40.0 / N
# _, h2 v( _- s# ?( {for t in range(T-1):- o) {0 S$ u9 V' A' w v5 t. J- o
s[t + 1] = s[t] - lamda * s[t] * i[t]/ _$ v" p. Y+ p0 @7 I! b
e[t + 1] = e[t] + lamda * s[t] * i[t] - sigma * e[t]
8 @: R: I* J9 r9 ?. _1 n# w3 r, s9 b i[t + 1] = i[t] + sigma * e[t] - gamma * i[t]
; Q3 c# [4 ?2 e* d" D' ?/ { r[t + 1] = r[t] + gamma * i[t]
% o1 X. o6 t8 g: l% p g9 _+ M& `$ \# M* y6 |
) f. ?; ~: N4 H. p5 j$ o% A Xfig, ax = plt.subplots(figsize=(10,6))
f$ [" l8 a L! ?7 C4 uax.plot(s, c='b', lw=2, label='S')6 S3 a: G( R6 z. L
ax.plot(e, c='orange', lw=2, label='E')" N% x# S7 [& a( t& g9 l
ax.plot(i, c='r', lw=2, label='I')
9 n9 b3 V" b- k" b# h) j: vax.plot(r, c='g', lw=2, label='R')* i N, E/ F$ ~9 J5 g# Y
ax.set_xlabel('Day',fontsize=20)$ ]* { G$ Z) J, ^* \2 C8 J
ax.set_ylabel('Infective Ratio', fontsize=20)
3 Q2 Z. w6 w5 {% S2 _; [4 `ax.grid(1)4 g- K+ O. N7 M' l2 c
plt.xticks(fontsize=20)
, ?5 e' q' x9 N& g0 fplt.yticks(fontsize=20)! m- g! {0 y* V
plt.legend();
: T) ~) q8 v! M
* A! ]9 `4 @! f( a& N
6 ]0 B) _$ j: M 3 ^. W# ~, b7 g4 o8 h/ S, {
$ k# V! Q, b& m( I2 ~% u按照模型的结果,此次疫情可能真的要持续到 三四月份。这个接触率 真的非常影响表现,模型给的是个常数,但是由于政府措施的原因,这应该是个变化的值。2 G/ S) {8 g0 ^ `+ x9 P
还有治愈率 也是。没有完美的模型,但是随着考虑因素的增多,就会越来越接近实际情况,从而指导政府的疫情方针政策的制定。. S7 T1 f* }7 K$ l" j% z
! b2 \: K) H7 E9 Z8 M* Z
+ C( o5 V$ S7 Q' \3 {& S$ q
s R& F3 R$ N$ q! V' a+ ?& K
5 ^6 ~8 ~8 H5 [( k9 Y |