- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564631 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174612
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
基因测序行业解决方案 |& [ z& E: u! Z& B# p" U
基因图被称为“上帝用以创造生命的语言”,但今天我们不谈上帝,不谈基因,我们谈谈基因在IT中的应用和现状。; u' w9 S6 |0 [) K# C3 m, Q3 ^ N
) p8 {9 X7 H' E, f# a- C段同学的基因测序行业解决方案,非常不错,赞!推荐!
9 @" j! j& h; y- r. ^* L7 G1 G; N5 E) z) m. j
/ J0 v" M, X% |3 [# r0 w& k
近年来,基因行业快速发展,由原本的实验室内的科研项目逐步走向临床应用,计算模式从离线向在线演进,带动医疗和健康行业的发展的同时,也让基因行业迎来新时代。5 C# Q7 D( O' [9 e, r" |
3 f$ a0 C3 E( k7 O# D: G1 h- p' [基因行业IT现状
, M1 S2 y/ u1 ]. k* c3 k/ i; ?4 p
% a& x. n5 h6 d1 @# _# a
# G: W0 W0 Q+ V3 N, v# q$ d* ], T
3 h }: q3 v- Z$ c i( s基因计算行业在现实中遇到了很多挑战,主要分为如下几部分:
& e6 l) h% K8 f1 o- y4 b+ b, u, l% [0 G" k
1、数据存储方面,由于基因测序技术的提升,测序成本降低。从最初的人类基因组开始细分扩展,目前已经涉及到肿瘤,遗传病检测。扩展到植物,远古生物,细菌,病毒,微生物的基因检测。因此数据种类和数据量是异常庞大,经常以PB为单位保存。
: F1 C4 R S$ Y7 z4 g4 B% w4 d x& H, j. s; X% z0 ?# Y
2、数据计算方面,大规模样本的数据分析和挖掘需要海量计算资源,本地计算成本太高,扩容慢,收效更慢
& U+ V9 m* f( \; |" B( o
4 I' E' x& s) h3、数据全球化,因为基因行业的特殊性,很多样本数据需要到当地采集,如果有数据共享,就需要一个全球化,多数据中心的支持
8 z- \8 E7 _0 v2 n8 L
6 K8 ~, R: ^7 v! R5 D. q4、数据安全方面,基因数据相对比较隐私,但传统的基因公司IT能力较弱,安全措施不到位,防御能力很弱。
9 R( U' w& n D5 ~$ ?" ~
% H4 s0 i% j- [$ r针对这些特点,我们很容易想到,云是一个很好的解决办法,为什么这么说?请听我细细道来:
1 @' x* [# B8 h) J* S1 I
) x( t4 [9 _( J$ X; Q( h( C& U$ |4 E1 a- x7 O8 o, h( W7 T
# Y! ^% ?" N) L( p$ |0 c8 R3 R. ~9 g7 p% U5 J/ C$ x6 R
8 y1 f4 t& J8 t+ z6 b& c. }/ x% R( G" X) @" W) I
7 m* R- L' j1 d/ d6 Y: \, K }9 h' _* s' j. V' @+ `8 Y
数据计算--云本身的弹性计算能满足基因数据的挖掘和分析,能用最少的时间计算出结果。减少了用户的部署环境,计算的时间成本。
9 j+ ?7 Q: b5 r1 }0 Q5 V3 @( J! w. q4 e5 ? I9 e% u
数据存储—云平台能提供海量的数据存储,且存储的格式多样,一般的云平台能支持文件存储,对象存储,根据数据类型还能支持冷存储(或叫归档存储)。对于PB级的数据,冷存储能减少很多客户成本。
: C8 m; g& n5 {( {$ Z) W3 l$ |( [5 O b+ U# ]3 }
数据传输—测序仪产生的大量数据需要靠专线,裸光纤网络进行传输,如果数据量为PB级的,则可以使用寄送硬盘方式传送到云厂家的数据中心。
8 Z3 U& h b+ |% _( e
+ b( B ~* p8 T& P数据安全—云平台本身的vpc的网络隔离,高防,数据加密等安全机制可以保证数据的安全性+ B4 a; {/ }! ?) ? x# W; k0 d
( ~; w& N5 H( B* D! p/ C0 v
1 ], `! N( {, N! Z2 E0 ?2 q4 L
+ y& U' v f3 x9 @0 c
( S* k; e" x/ ?
基因行业的痛点+ t: `7 B5 T- p& E# c. y
8 C Q* {, }2 F+ ]$ I, @1 H* V- ?& P5 C# j, q4 R0 T
以上说到了基因行业使用云的好处,现在说说基因行业遇到的痛点! H9 ~7 I! I( A7 Y9 W: b
& G( L- z& J# V1 W* o( ?基因行业产生的原始数据台庞大,动则PB以上,如果从本地传输到云端,使用公网不知道传输到何年何月,如果使用带宽10GB的裸光纤,传输1PB数据需要连续15天,这样的时间跨度没法接受,即使采用寄送硬盘方式,也是需要很大的时间,人力,财务成本。所以,怎么解决数据端传输的云端是第一步,目前只能从远端减少数据量(比如针对基因数据研发一套数据压缩算法)- L: B7 j7 b9 G, p/ `' {5 ?
4 ?8 C$ n; U5 S0 A1 G2 e9 b
大量基因数据存储在云端,从主观上可能存在数据泄露的可能,这个也是公有云的弊端之一
; v: P. H. q* T+ B% i' Q: O: S7 Q ] b
基因行业盈利模式还是集中在基因测序的医院,个人,研发机构。国内除了华大等一批上市的领头羊以外,大批的中小型企业都处于寻找商业模式的阶段。$ d: L' l* ]. A3 k
: m) M: u& u2 i3 e) u3 U
2 r# q U9 U+ w5 `. B4 i& a9 q9 ~" } E! ~: o- b! V
基因测序产业链) T k+ R3 n/ W
3 w+ C- u7 _" X3 {$ V
* m5 w" o% r( e5 U9 W; L1 @+ {+ m7 s& O
5 s2 n1 a2 Z1 S) ?* L0 R
国内基因测序产业链分为基础研究、上游设备端、中游测序服务端、基因大数据服务和下游应用端
: m( U0 B, z5 v
3 O4 M+ r$ {5 h/ m+ S) I其中基础研究主要有药物基因组学、医学基础研究、生物学基础研究、微生物宏基因组学等;上游主要是测序设备、耗材及试剂的研发;中游按照疾病诊断的流程分为疾病预防与早筛、辅助疾病诊断和药物伴随诊断;数据服务包括基因数据存储、分析和解读等;下游应用端主要为科研机构、医疗机构、药企、第三方检验中心和个人消费者。
3 ^( F! L- Q. C$ M& k2 F1 |% m# F: `; ]3 y: G1 U
. E% X# X- B, `) m
9 ]8 B/ p7 C0 J; X
8 O' |% s% D" G- q9 I
3 K5 o! y4 k- m" c. S
6 t+ C" Z1 s; q9 \4 Y3 F+ K( s& X
$ y) I( i, Q. k4 d( m( F" S9 Y; W ]1 ~$ p
* f! G7 D* K8 t0 k! j9 F6 \1 K
上游领域,目前的测序技术还停留在二代测序,部分已经使用三代测序技术。整个市场被国外基因检测仪器开发商Illumina长期处于垄断地位,国内主要是华大基因占用一定市场率。
- [) G$ r9 {6 L2 Y2 l+ p# v' m+ b/ r y9 k2 y5 ]7 ]. a' g* m
中游领域主要以基因组测序积累的数据为基础,应用场景为产前筛查、遗传病检测癌症早筛、药物分子筛选。国内市场以华大基因与贝瑞基因(贝瑞和康)为头,遥遥领先。同时有多家云计算,IT厂家提供IT技术基础,数据分析服务3 U, O7 F: H5 P& A. \7 m0 L2 s+ w
! d) q6 C& ^; o6 e; P# i& a: W5 }
下游领域包括:产前筛查、癌症基因检测等检测的需求人士、药厂、医院及科研机构。而目前,基因检测服务中以NIPT为代表的生育健康类服务占据了一半以上的市场,但NIPT市场华大基因和贝瑞和康已经形成垄断。
: y8 T/ n1 D1 J- r( D: M8 z+ v- v- T: A: @$ U4 S$ }# m
1 ^8 I% }6 _9 H; m6 v8 ~
6 c% k+ I9 K/ p: _- [
( x/ A! Y# L) ?% }9 Y* }1 ?3 `0 O- ~: _3 n) N
基因测序应用场景
0 L7 ^9 p. j9 t9 h; n) U" h# }1 P9 K7 l; t- ^
. O% _# L0 r) s( U5 e1 }! {9 U: V
* P: _1 T) _* R# @ R# M1 P9 X, N& T8 W' v
整体来说,目前基因行业的应用场景还是一片蓝海,有很多待需要开发的场景和业务,随着测序成本的降低,能应用的领域也越来越广。同时对IT技术的依赖也会越来越旺盛。# p* I$ G" l8 S; W8 f4 x
6 g2 n8 x0 X. a
7 Z% x/ W6 W( g3 T1 O3 I2 T
8 T/ n% r) F+ d# g5 D+ w- D" v
|
zan
|