数学建模社区-数学中国

标题: 基因测序行业解决方案 [打印本页]

作者: 杨利霞    时间: 2019-4-21 14:53
标题: 基因测序行业解决方案
基因测序行业解决方案, B0 R% h* u; `0 U3 |( p0 k( ^
基因图被称为“上帝用以创造生命的语言”,但今天我们不谈上帝,不谈基因,我们谈谈基因在IT中的应用和现状。
  x' T) g3 V% M8 t6 y( l* `( q
* F6 t" X1 i) C8 _5 b段同学的基因测序行业解决方案,非常不错,赞!推荐!6 X) j7 q- l! o  K

: R; A9 t1 K) k& r- ]1 {7 {/ e5 F+ ^/ v$ S" ~1 ~
近年来,基因行业快速发展,由原本的实验室内的科研项目逐步走向临床应用,计算模式从离线向在线演进,带动医疗和健康行业的发展的同时,也让基因行业迎来新时代。5 i. F# a& l3 h. Y/ T9 t
0 P: Q# j( L0 V: z
基因行业IT现状( [+ g8 \5 t; s' ^- A! w

* M) E" h. m) l. j; J2 p% X4 E2 @+ L6 n' Q( G5 I: S: T- X

9 M1 B) U0 `8 A5 A基因计算行业在现实中遇到了很多挑战,主要分为如下几部分:
9 W2 H7 I9 Y2 v$ T; t
% `: V; ^9 n" {- Q5 Y( l' j# {1、数据存储方面,由于基因测序技术的提升,测序成本降低。从最初的人类基因组开始细分扩展,目前已经涉及到肿瘤,遗传病检测。扩展到植物,远古生物,细菌,病毒,微生物的基因检测。因此数据种类和数据量是异常庞大,经常以PB为单位保存。
5 X( o8 z+ q4 s: G7 G9 l
( H) v+ U' N/ b/ \# ]2、数据计算方面,大规模样本的数据分析和挖掘需要海量计算资源,本地计算成本太高,扩容慢,收效更慢* G& j! V) H3 m

& ~2 z6 k. N$ C- h  ]3、数据全球化,因为基因行业的特殊性,很多样本数据需要到当地采集,如果有数据共享,就需要一个全球化,多数据中心的支持6 m* B5 [" w+ f$ @4 D; s$ p
; M% K7 b3 f1 u/ D9 ^( [5 b0 L
4、数据安全方面,基因数据相对比较隐私,但传统的基因公司IT能力较弱,安全措施不到位,防御能力很弱。9 [$ F' b% T6 l/ E- r  _: M

  d; U  S+ j( K/ x3 X0 Y8 G% @针对这些特点,我们很容易想到,云是一个很好的解决办法,为什么这么说?请听我细细道来:
7 a. k$ ^# B9 c6 N* ]6 h# D. S4 z/ v3 Z* A9 j( G$ U! W! L
, `9 ]0 K5 O) Z/ K9 ?  q9 {" q/ D) x

, k; J' W3 l8 [
% d+ Q/ V; x9 W: K/ U$ ]7 }- F
0 X# D/ Q, O" q7 K' A+ A7 }+ V( D: p4 k1 Z( T7 w
- d2 V3 K9 E. {% C; X0 z( }
+ w1 D5 w% ]' y& J) o
数据计算--云本身的弹性计算能满足基因数据的挖掘和分析,能用最少的时间计算出结果。减少了用户的部署环境,计算的时间成本。" Z8 X2 p9 t( w/ r) J6 Z  _
; D! b; ?1 H+ V8 t& B
数据存储—云平台能提供海量的数据存储,且存储的格式多样,一般的云平台能支持文件存储,对象存储,根据数据类型还能支持冷存储(或叫归档存储)。对于PB级的数据,冷存储能减少很多客户成本。2 ?2 q/ ~! |% j4 Z4 z  {+ T. s4 L/ L

2 b; W5 c* W; A- F9 P数据传输—测序仪产生的大量数据需要靠专线,裸光纤网络进行传输,如果数据量为PB级的,则可以使用寄送硬盘方式传送到云厂家的数据中心。
8 g9 v, w# p. w8 U5 u" Y5 ?# g
) p8 l/ ?0 g: \; \& |1 t2 d数据安全—云平台本身的vpc的网络隔离,高防,数据加密等安全机制可以保证数据的安全性
/ E2 X3 `. k. m* m) \6 ]6 y) T' h; D7 f" s; |/ A2 [6 O3 Q

  l: U  ?" h  j8 n4 V0 ?
" P0 r: N* q, H/ F, g# @8 @6 `, a2 _# f9 g- }: C4 d0 `
基因行业的痛点
5 U9 }* d) @( [5 h$ W
+ z/ |- k- o* M5 Z- G# M5 `9 V* e& ^" k0 w, @  N0 u. ^
以上说到了基因行业使用云的好处,现在说说基因行业遇到的痛点
( ^! d. P% s' s. V% ~  F8 O  d7 @5 L! o" J: X
基因行业产生的原始数据台庞大,动则PB以上,如果从本地传输到云端,使用公网不知道传输到何年何月,如果使用带宽10GB的裸光纤,传输1PB数据需要连续15天,这样的时间跨度没法接受,即使采用寄送硬盘方式,也是需要很大的时间,人力,财务成本。所以,怎么解决数据端传输的云端是第一步,目前只能从远端减少数据量(比如针对基因数据研发一套数据压缩算法)* V  L1 D: G0 t$ I4 T
3 W) M7 ?) [* G
大量基因数据存储在云端,从主观上可能存在数据泄露的可能,这个也是公有云的弊端之一+ B! ]- d3 l. X4 n/ _* Q
! w" J  f. F% N0 u
基因行业盈利模式还是集中在基因测序的医院,个人,研发机构。国内除了华大等一批上市的领头羊以外,大批的中小型企业都处于寻找商业模式的阶段。
, h7 W# x$ `/ L/ N
" p# M( ?: T/ r3 {3 m! t$ P  \/ j$ u4 S: V
1 o0 p( }- b3 L2 j2 b# X' {1 t3 k
基因测序产业链( {7 B8 Z/ s9 H# W

+ v$ Q5 K  ]! J- |% u. z8 S+ \* W& h8 c' }- Q

- y7 R, g0 x. V1 V; ~5 T
, i" c, L& G" j4 y" _" E- q+ O国内基因测序产业链分为基础研究、上游设备端、中游测序服务端、基因大数据服务和下游应用端
. d% w# y1 u! ^" |2 n1 l" \0 ?( o% I$ v5 w. @
其中基础研究主要有药物基因组学、医学基础研究、生物学基础研究、微生物宏基因组学等;上游主要是测序设备、耗材及试剂的研发;中游按照疾病诊断的流程分为疾病预防与早筛、辅助疾病诊断和药物伴随诊断;数据服务包括基因数据存储、分析和解读等;下游应用端主要为科研机构、医疗机构、药企、第三方检验中心和个人消费者。& Q: Y7 k* s# \% y
$ d+ P3 m7 {3 f
$ A" I( r' H% K6 q+ z: k, \
2 O% a/ E* g& \$ `' Q5 `

8 a% N5 V+ R9 ~& @  z9 B. U; s" ]; Z

- H* R4 P" s, t; U' R# K' |0 U  s+ v: V$ S% F- m

- T0 e& o/ ]0 I; N
6 u; t* C/ w+ n9 i; J上游领域,目前的测序技术还停留在二代测序,部分已经使用三代测序技术。整个市场被国外基因检测仪器开发商Illumina长期处于垄断地位,国内主要是华大基因占用一定市场率。+ z; o( t6 q. M; M& Z/ l0 |5 S0 F) X

+ U, }+ @. f7 z3 e中游领域主要以基因组测序积累的数据为基础,应用场景为产前筛查、遗传病检测癌症早筛、药物分子筛选。国内市场以华大基因与贝瑞基因(贝瑞和康)为头,遥遥领先。同时有多家云计算,IT厂家提供IT技术基础,数据分析服务* i' G* `% Z* \
4 ~( ~7 ]4 b1 c) ?* e
下游领域包括:产前筛查、癌症基因检测等检测的需求人士、药厂、医院及科研机构。而目前,基因检测服务中以NIPT为代表的生育健康类服务占据了一半以上的市场,但NIPT市场华大基因和贝瑞和康已经形成垄断。
9 }7 O, p+ P6 K& B
* y9 }0 e  t6 T: p, O/ g" [
& Q7 |  \6 f3 Y' [8 }# Q, p
! H% G- n) t' j! {5 g% {% v9 I; D" G' B# y
  D2 q8 F/ [7 w/ u9 v
基因测序应用场景
7 l0 _+ d" X/ c/ D! h2 `3 g. |4 Y  w' E

" a/ {; e' H/ s6 f6 u4 b6 z/ E& Z$ T' L. f( P9 j) w. C+ [3 C

+ R  l' s& ?( Z; n0 d2 z" l1 S整体来说,目前基因行业的应用场景还是一片蓝海,有很多待需要开发的场景和业务,随着测序成本的降低,能应用的领域也越来越广。同时对IT技术的依赖也会越来越旺盛。/ i1 J2 T5 p( M: R
4 w; @3 M3 s  n7 a4 E0 C- Z

7 Y* x3 H& e0 r" l) ^! y1 b5 n  C  C

数学建模解题思路与方法.pptx

117.69 KB, 下载次数: 7, 下载积分: 体力 -2 点






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5