- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564636 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174614
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
基因测序行业解决方案
9 C, L$ p6 |; g8 j& r基因图被称为“上帝用以创造生命的语言”,但今天我们不谈上帝,不谈基因,我们谈谈基因在IT中的应用和现状。( N) f J6 h# M) ?/ E( [
7 Q ~! `2 v$ G5 }7 Z" P
段同学的基因测序行业解决方案,非常不错,赞!推荐!0 g$ r: @2 i! _
) s" y* W+ g; c2 d& f) z
% S* M) a* o% i$ h近年来,基因行业快速发展,由原本的实验室内的科研项目逐步走向临床应用,计算模式从离线向在线演进,带动医疗和健康行业的发展的同时,也让基因行业迎来新时代。$ i; ` L* {" N# z# i& X u
/ C# l8 [" ~( l: c9 G" h
基因行业IT现状& |' T; V* D: N; s" [7 b$ J
B1 N B* C. |/ C' @0 `- F$ v) ~" | Z/ J _3 C) m. J
7 L' ~7 C5 K z- ~; z2 S基因计算行业在现实中遇到了很多挑战,主要分为如下几部分:
! |% g' B# u0 U! a$ x. \+ W8 L; M1 U) f! `: \7 t1 U4 o
1、数据存储方面,由于基因测序技术的提升,测序成本降低。从最初的人类基因组开始细分扩展,目前已经涉及到肿瘤,遗传病检测。扩展到植物,远古生物,细菌,病毒,微生物的基因检测。因此数据种类和数据量是异常庞大,经常以PB为单位保存。% i* a ~# a- I) l9 \
: m' X" Z N( v5 m% m! }( i3 X
2、数据计算方面,大规模样本的数据分析和挖掘需要海量计算资源,本地计算成本太高,扩容慢,收效更慢
' N/ p$ N1 J& {$ |- O- m& O2 y/ C- G( q% a
3、数据全球化,因为基因行业的特殊性,很多样本数据需要到当地采集,如果有数据共享,就需要一个全球化,多数据中心的支持
6 K' [7 v9 w8 J9 A) X$ W: A) ~* o( Z9 U
, H8 r# J. V+ f& V3 g( k9 s4、数据安全方面,基因数据相对比较隐私,但传统的基因公司IT能力较弱,安全措施不到位,防御能力很弱。
! k6 c* J2 }0 ?& T
* ]; f& Q3 J$ p4 ?9 s' H) d9 ]针对这些特点,我们很容易想到,云是一个很好的解决办法,为什么这么说?请听我细细道来:
6 [) ?( ~4 u: z9 O8 Y3 [3 V8 l6 E% y V: v
8 j: D8 W5 f4 Q5 ]0 K( ~
6 M: H- q8 g* H- S
+ f) `& }6 [7 P
9 w4 J% O: N: }4 h5 O, K8 c- {, k" c) T7 Y: m9 z9 r. o
4 Q5 M" c# U+ f* R/ t7 k( ]/ V7 r" ?, Y
数据计算--云本身的弹性计算能满足基因数据的挖掘和分析,能用最少的时间计算出结果。减少了用户的部署环境,计算的时间成本。
9 H3 v9 X! x$ @; v( O
' |/ m8 I8 l% n3 q. n! }数据存储—云平台能提供海量的数据存储,且存储的格式多样,一般的云平台能支持文件存储,对象存储,根据数据类型还能支持冷存储(或叫归档存储)。对于PB级的数据,冷存储能减少很多客户成本。
$ B- C, y. M' c6 K# B; m# M6 G8 Y6 y' g# ] ]5 O; k
数据传输—测序仪产生的大量数据需要靠专线,裸光纤网络进行传输,如果数据量为PB级的,则可以使用寄送硬盘方式传送到云厂家的数据中心。2 D0 S1 g. q( W: J
3 R/ U7 Q% m6 f% H0 r: M3 v数据安全—云平台本身的vpc的网络隔离,高防,数据加密等安全机制可以保证数据的安全性
- N4 E- Y/ \) R; H& `3 N- B9 x
2 u; j( B$ n9 g0 L: }4 Z( `
2 z o# L9 ]) Q! b
, M9 c' G8 [3 C, Z# K" K |8 a( x" f- {# I& h
基因行业的痛点
5 h1 H% f- ?7 b9 N& X
/ H! t1 _8 d* q" Z$ G; b* |+ U2 W9 o
以上说到了基因行业使用云的好处,现在说说基因行业遇到的痛点$ M( M" h6 v6 [! Y; ]* P
& k- P1 i' f: {' D* F. Q6 [0 i! K
基因行业产生的原始数据台庞大,动则PB以上,如果从本地传输到云端,使用公网不知道传输到何年何月,如果使用带宽10GB的裸光纤,传输1PB数据需要连续15天,这样的时间跨度没法接受,即使采用寄送硬盘方式,也是需要很大的时间,人力,财务成本。所以,怎么解决数据端传输的云端是第一步,目前只能从远端减少数据量(比如针对基因数据研发一套数据压缩算法)8 ]- q' d, d2 S7 E
2 G8 A: T5 e7 v1 {& b; P' S: V大量基因数据存储在云端,从主观上可能存在数据泄露的可能,这个也是公有云的弊端之一
6 Q7 d/ `# C/ p! ^5 E: P- s, d" }2 g/ v+ o3 a- w
基因行业盈利模式还是集中在基因测序的医院,个人,研发机构。国内除了华大等一批上市的领头羊以外,大批的中小型企业都处于寻找商业模式的阶段。
0 Q/ A; j- t6 [) Q+ L5 y6 q: }# M$ s2 @/ P* B
( i% n8 R2 T/ E& P+ n, [% _
: U# @6 u" }9 L8 z* D1 V1 e
基因测序产业链5 y5 ~5 \4 i7 K* p; e8 K( M" b
# ]# \, V2 d& B; Z
% Z% [1 Y/ |- a9 g% `9 p
/ v( d# s( W {) F, \) }9 x' a( L
$ s! Q6 g7 E0 ` G国内基因测序产业链分为基础研究、上游设备端、中游测序服务端、基因大数据服务和下游应用端
2 w H' ]& n' N! F4 p5 Q
& }; O- I- R y' k" a _! ]其中基础研究主要有药物基因组学、医学基础研究、生物学基础研究、微生物宏基因组学等;上游主要是测序设备、耗材及试剂的研发;中游按照疾病诊断的流程分为疾病预防与早筛、辅助疾病诊断和药物伴随诊断;数据服务包括基因数据存储、分析和解读等;下游应用端主要为科研机构、医疗机构、药企、第三方检验中心和个人消费者。
% H7 }% P, x+ P3 N" `. v! d/ A& Y/ i5 t% v' O9 {- Z
2 M0 S7 b, w2 O" [3 @" k
/ C* n* ]* x# ^" b! D4 s9 U) R2 w
' w, B4 P. Q2 W+ k
8 T& E" i& Z0 M) e k6 d3 ?$ Q
+ n+ V% ^. ^. V- f* p
4 s' A- s; d! E, C, ]5 m! \' N* b) Z2 L$ s# K
5 L) l* ^+ S) g7 X* ]4 w. a& ?- k2 q上游领域,目前的测序技术还停留在二代测序,部分已经使用三代测序技术。整个市场被国外基因检测仪器开发商Illumina长期处于垄断地位,国内主要是华大基因占用一定市场率。
3 z+ w, J* }4 J. J: i x' }( x4 z1 A1 c& R1 t( S. x8 F
中游领域主要以基因组测序积累的数据为基础,应用场景为产前筛查、遗传病检测癌症早筛、药物分子筛选。国内市场以华大基因与贝瑞基因(贝瑞和康)为头,遥遥领先。同时有多家云计算,IT厂家提供IT技术基础,数据分析服务
; J2 p: f! b7 N
' L, G$ L% Y& L) q) g下游领域包括:产前筛查、癌症基因检测等检测的需求人士、药厂、医院及科研机构。而目前,基因检测服务中以NIPT为代表的生育健康类服务占据了一半以上的市场,但NIPT市场华大基因和贝瑞和康已经形成垄断。
0 e( N6 E& L U3 r# G. ~/ o8 k- U, _2 ^2 g
) k7 Z/ v% r8 o6 L( {9 z9 P" I% x: @
. N8 e' V8 f- j H( V# J- I
; U5 }7 Q% |( _2 e7 J2 k z' y, m2 O5 G9 V( K6 ?
基因测序应用场景
( G/ D) E' e N2 i. u/ F2 o: f% ], V5 l
7 x5 N H3 A' Y8 {' Y$ c% m7 E8 K- N; U0 U3 u* X o" Z% }* F
3 E, ~" x8 @) H$ D整体来说,目前基因行业的应用场景还是一片蓝海,有很多待需要开发的场景和业务,随着测序成本的降低,能应用的领域也越来越广。同时对IT技术的依赖也会越来越旺盛。: l& T1 y' x! {$ G7 R
: w: @: t" p% q2 n& a, F5 y' o( D
0 |% ^1 j" g! i9 Q
2 Z4 M6 i$ j2 G2 z+ v; w2 V |
zan
|