- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564628 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174611
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
基因测序行业解决方案; H! i) l2 b7 {. x, ]* a4 G! R
基因图被称为“上帝用以创造生命的语言”,但今天我们不谈上帝,不谈基因,我们谈谈基因在IT中的应用和现状。
3 G9 S7 f% U/ J! m
+ N9 |% l7 X* Z, H; n段同学的基因测序行业解决方案,非常不错,赞!推荐!
+ b4 F7 i5 f6 ]" C2 ]9 P7 D' p
. {1 F+ _ g# L9 f$ g8 H. h9 t2 N% X; Y5 p t
近年来,基因行业快速发展,由原本的实验室内的科研项目逐步走向临床应用,计算模式从离线向在线演进,带动医疗和健康行业的发展的同时,也让基因行业迎来新时代。; `2 |5 O+ c9 d
0 V7 H: P( D6 }' x( q0 s5 h基因行业IT现状( v: u3 K* F) y/ `9 f3 V
- o& j, z) K; [& p7 Z6 Z$ A8 L- V6 f% b5 a0 w& C8 @
& g7 c, q5 g0 Q! E, o7 ~基因计算行业在现实中遇到了很多挑战,主要分为如下几部分:2 X9 E# i/ P% W$ x z& O
6 w) W0 ~8 o4 u# O& n4 r1、数据存储方面,由于基因测序技术的提升,测序成本降低。从最初的人类基因组开始细分扩展,目前已经涉及到肿瘤,遗传病检测。扩展到植物,远古生物,细菌,病毒,微生物的基因检测。因此数据种类和数据量是异常庞大,经常以PB为单位保存。
; V" f! K$ `' [7 J# ^$ O# y- @1 `% a% J
2、数据计算方面,大规模样本的数据分析和挖掘需要海量计算资源,本地计算成本太高,扩容慢,收效更慢
, g2 E& X" D, a$ f+ w# V! g
1 B( [# a% i0 m; G' a& _: \ L, T# M2 O3、数据全球化,因为基因行业的特殊性,很多样本数据需要到当地采集,如果有数据共享,就需要一个全球化,多数据中心的支持! n- u7 z1 c! P% M, V8 d1 b
% t7 l0 S9 c- P9 S# c7 O1 n4、数据安全方面,基因数据相对比较隐私,但传统的基因公司IT能力较弱,安全措施不到位,防御能力很弱。2 m$ N1 z' D( p: i/ b
8 `! X ]& X6 I' [% Z
针对这些特点,我们很容易想到,云是一个很好的解决办法,为什么这么说?请听我细细道来:$ H( ` {" y+ |8 E" a! M* V
: p+ z) T/ F& e4 b
?% k0 }; _6 E* b* `! m3 t# p8 r4 v1 i3 N4 X# i4 m5 i' D6 f
% f: y% ?3 @) Q" y
. e0 R2 o& R: |1 ~$ V
0 N8 v" i0 E4 O' e5 e) q
' { ]: A0 U2 R! q( D- T& ^: k/ o/ p j; u! i, I
数据计算--云本身的弹性计算能满足基因数据的挖掘和分析,能用最少的时间计算出结果。减少了用户的部署环境,计算的时间成本。2 F, Q+ `7 m1 u2 a- W! ~2 g! y
( p! c" L; ]# B' g数据存储—云平台能提供海量的数据存储,且存储的格式多样,一般的云平台能支持文件存储,对象存储,根据数据类型还能支持冷存储(或叫归档存储)。对于PB级的数据,冷存储能减少很多客户成本。1 v2 [0 k7 V/ b
! Q1 A. d0 t$ o" B6 P" j2 a数据传输—测序仪产生的大量数据需要靠专线,裸光纤网络进行传输,如果数据量为PB级的,则可以使用寄送硬盘方式传送到云厂家的数据中心。
9 p6 H$ d9 R/ P [! r. P( u1 {) V3 @& e- A1 D/ h/ ~! e$ K
数据安全—云平台本身的vpc的网络隔离,高防,数据加密等安全机制可以保证数据的安全性1 A6 \/ a4 w! p* F1 \ L
, P. Q" w$ f$ @9 [. F+ M
& ^8 n( q; K- h6 U3 I1 K9 @6 n. q( l2 {" e$ X6 `8 @
0 w6 L0 \' T1 G$ W& [
基因行业的痛点
# D& N3 a0 ?; B: a/ v7 [+ q' d, v5 @; ?9 i8 E5 @
7 n9 X' z3 o& ], X# C
以上说到了基因行业使用云的好处,现在说说基因行业遇到的痛点
' K: \+ R6 K5 a' S
9 G$ S7 p& u& t- E3 M/ E基因行业产生的原始数据台庞大,动则PB以上,如果从本地传输到云端,使用公网不知道传输到何年何月,如果使用带宽10GB的裸光纤,传输1PB数据需要连续15天,这样的时间跨度没法接受,即使采用寄送硬盘方式,也是需要很大的时间,人力,财务成本。所以,怎么解决数据端传输的云端是第一步,目前只能从远端减少数据量(比如针对基因数据研发一套数据压缩算法)
6 Z/ t& t5 _( I+ |0 y% a/ T( L3 C0 p, A- X
大量基因数据存储在云端,从主观上可能存在数据泄露的可能,这个也是公有云的弊端之一
; j0 p9 ?% n& q' S: |6 O, c6 Y+ d3 b( R- e- d7 y2 S7 r6 A
基因行业盈利模式还是集中在基因测序的医院,个人,研发机构。国内除了华大等一批上市的领头羊以外,大批的中小型企业都处于寻找商业模式的阶段。
6 _5 w# j9 x% A3 V
. X) T9 @/ R) P$ ^& n) b% @, e5 R6 s4 D- l
+ G G O9 q% z8 E. r. b8 Y基因测序产业链
) x1 b5 h9 H" |% s w
: S) M! F( Y1 b1 K! g, \8 k+ J1 F, X, H5 b! z3 ?- z$ M
2 P& J7 ~1 V) j: R: Z3 ^
% T3 c7 L/ V: R7 t国内基因测序产业链分为基础研究、上游设备端、中游测序服务端、基因大数据服务和下游应用端4 C7 e3 z S, D
" h6 [' l9 n- a# @+ \; ]. B! o其中基础研究主要有药物基因组学、医学基础研究、生物学基础研究、微生物宏基因组学等;上游主要是测序设备、耗材及试剂的研发;中游按照疾病诊断的流程分为疾病预防与早筛、辅助疾病诊断和药物伴随诊断;数据服务包括基因数据存储、分析和解读等;下游应用端主要为科研机构、医疗机构、药企、第三方检验中心和个人消费者。' } C/ m3 k2 \/ O$ s! B+ j+ I
5 t/ `) F+ q# [# m1 O
+ ~3 U3 ]+ O' d P5 n0 d
u j% P0 ~2 s
9 e; h9 I/ }% r( Q/ z0 x3 J) v8 d! }9 B, M' f2 b2 n: {6 r
0 j. p8 {4 T3 E( }4 o8 z+ D6 Y
* [: {; _+ L. _% a' @
' M. X, v: U: ^0 D" I" W2 o+ `7 _0 j- [" b6 F
上游领域,目前的测序技术还停留在二代测序,部分已经使用三代测序技术。整个市场被国外基因检测仪器开发商Illumina长期处于垄断地位,国内主要是华大基因占用一定市场率。) N7 X3 \' T* P. r- b6 E
. V7 Z/ `( o2 s8 t
中游领域主要以基因组测序积累的数据为基础,应用场景为产前筛查、遗传病检测癌症早筛、药物分子筛选。国内市场以华大基因与贝瑞基因(贝瑞和康)为头,遥遥领先。同时有多家云计算,IT厂家提供IT技术基础,数据分析服务
8 y Q6 J# _ ^/ I" a
% S8 k2 r* P& h下游领域包括:产前筛查、癌症基因检测等检测的需求人士、药厂、医院及科研机构。而目前,基因检测服务中以NIPT为代表的生育健康类服务占据了一半以上的市场,但NIPT市场华大基因和贝瑞和康已经形成垄断。
3 ~+ @6 r, j/ [2 R& g# z5 J9 a/ T, H- |: I( d
1 |" c5 f5 ^0 k* @& R9 z
6 T6 K8 z2 ?, Q6 a
b% V6 M7 \, F" @; l3 h
, B. v/ o' ?6 x5 d H基因测序应用场景
1 h! N8 G# c& i" w: B' T# u
2 C$ J& G. d8 {. O& w" V
! g8 l' ^! d8 a9 p* v# c
. L0 s8 K4 o0 g) {# t+ q4 J# Y' q( e* c) o a
整体来说,目前基因行业的应用场景还是一片蓝海,有很多待需要开发的场景和业务,随着测序成本的降低,能应用的领域也越来越广。同时对IT技术的依赖也会越来越旺盛。
: ]( R) E3 M! ?* O+ c0 S5 B5 j
' ]. I' L3 i4 G$ R! I0 j; i. h/ d5 H) p+ b) E. p0 r6 d0 v
) H# p) l* ^. x) G8 b( U6 p4 B |
zan
|