- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563401 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174243
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
基因测序行业解决方案% f% i' g- o6 s& R
基因图被称为“上帝用以创造生命的语言”,但今天我们不谈上帝,不谈基因,我们谈谈基因在IT中的应用和现状。' S- V9 l8 _1 {6 e- b' b$ q
2 `3 f; T d: ` e* `" c段同学的基因测序行业解决方案,非常不错,赞!推荐!
5 \2 Z& B5 o6 M+ n; a% l
$ D' o: e2 _6 _
! I9 ?- V0 z A. q7 ^近年来,基因行业快速发展,由原本的实验室内的科研项目逐步走向临床应用,计算模式从离线向在线演进,带动医疗和健康行业的发展的同时,也让基因行业迎来新时代。) M6 A$ g8 x( E. h" X
" N' l) I, w+ R4 W- k基因行业IT现状* @/ `+ x$ y& |. O9 l' |4 t7 _
. L- x, B& I. v a9 j9 f3 ]# [% P+ ]
8 j2 t, W% s4 y% A. @: K5 u
" _; t% H8 \4 n9 t5 Z. [2 U基因计算行业在现实中遇到了很多挑战,主要分为如下几部分:0 ~( ~% z u$ I; d, r3 L
& @$ `/ D; s3 [- |! z: g- h& q3 E1、数据存储方面,由于基因测序技术的提升,测序成本降低。从最初的人类基因组开始细分扩展,目前已经涉及到肿瘤,遗传病检测。扩展到植物,远古生物,细菌,病毒,微生物的基因检测。因此数据种类和数据量是异常庞大,经常以PB为单位保存。
( A' L* v/ m9 ?2 U3 E' H4 z2 Z+ Y( o1 M
' q/ [* A* I7 x+ Z" ~0 G0 E* Y2、数据计算方面,大规模样本的数据分析和挖掘需要海量计算资源,本地计算成本太高,扩容慢,收效更慢
. \* z; _. v7 }! c, w
. f3 l5 G _) v* f7 L* t* c6 Y3、数据全球化,因为基因行业的特殊性,很多样本数据需要到当地采集,如果有数据共享,就需要一个全球化,多数据中心的支持
$ l* W* h/ N5 s& ~& Q6 J7 ?1 C ]
4、数据安全方面,基因数据相对比较隐私,但传统的基因公司IT能力较弱,安全措施不到位,防御能力很弱。
/ P; \6 x4 V$ D$ M0 K
/ w, i# ?- m) o6 r; x针对这些特点,我们很容易想到,云是一个很好的解决办法,为什么这么说?请听我细细道来:
: y/ p; A f$ B+ S& Z0 N
, b. _& `+ t. Z/ b1 O5 x0 W
' f* U9 _7 B- d. J3 _9 m$ ~$ V8 y' b6 B( x5 M
* v; h. J2 H! Y8 }4 }6 T
/ ?( R- O' y3 O6 ?" ^# d! V, p) G8 B3 g; I2 |
/ G, t( r7 n/ V- w3 H4 m6 j1 k/ v
& `$ R3 x, \& M* @. }) _
数据计算--云本身的弹性计算能满足基因数据的挖掘和分析,能用最少的时间计算出结果。减少了用户的部署环境,计算的时间成本。/ h1 E6 w8 z! ?$ ^# w
7 L1 F9 z( }* G6 f$ j) k9 L- U
数据存储—云平台能提供海量的数据存储,且存储的格式多样,一般的云平台能支持文件存储,对象存储,根据数据类型还能支持冷存储(或叫归档存储)。对于PB级的数据,冷存储能减少很多客户成本。4 _/ B+ o9 p/ c
! q q4 p" i- O1 L$ K
数据传输—测序仪产生的大量数据需要靠专线,裸光纤网络进行传输,如果数据量为PB级的,则可以使用寄送硬盘方式传送到云厂家的数据中心。
5 t$ x/ J3 h2 C. W
2 y* E/ @! t' @0 F0 g数据安全—云平台本身的vpc的网络隔离,高防,数据加密等安全机制可以保证数据的安全性
' ?: m! r" r P ?
( M, c& }* K; z. u( E
2 j0 w7 ]) g/ U* p# N; v4 s+ M; C" }& o, H0 @" j
% C9 ? F* c, q" O. s基因行业的痛点
r: } v: v# Z1 E7 m9 y/ N6 a) V! n) X2 H2 _% X1 ?* h4 V
. t0 X7 i* p% Y- P: A2 _以上说到了基因行业使用云的好处,现在说说基因行业遇到的痛点
/ u) P/ L7 |1 i; p' n
, p% I1 D7 i1 P1 |4 p6 j! ~3 G, |基因行业产生的原始数据台庞大,动则PB以上,如果从本地传输到云端,使用公网不知道传输到何年何月,如果使用带宽10GB的裸光纤,传输1PB数据需要连续15天,这样的时间跨度没法接受,即使采用寄送硬盘方式,也是需要很大的时间,人力,财务成本。所以,怎么解决数据端传输的云端是第一步,目前只能从远端减少数据量(比如针对基因数据研发一套数据压缩算法)
: T* b7 z( F3 O; h
- K2 V$ }7 Q8 l大量基因数据存储在云端,从主观上可能存在数据泄露的可能,这个也是公有云的弊端之一
1 w; P: C- m" z9 s6 r) N0 ~, k: s# F, u- `
基因行业盈利模式还是集中在基因测序的医院,个人,研发机构。国内除了华大等一批上市的领头羊以外,大批的中小型企业都处于寻找商业模式的阶段。
% \2 }. H' ?6 L7 x, d3 P: W6 M3 h# B9 N; i6 |
2 g8 {3 E# B; ^% |1 L- \) F' ^' ^6 g* t2 c( ~
基因测序产业链
[, c* X$ `0 G% }
" E/ M' T) t9 \1 F* f* y( }( C+ K5 {. J& @$ H, W
8 S: ]2 Q" g9 T0 L) ^
+ A+ P E5 O# ]0 I B) c. i
国内基因测序产业链分为基础研究、上游设备端、中游测序服务端、基因大数据服务和下游应用端
6 ^/ j3 p. R& b+ o) v. v3 X( W
! j' v% d& ^( P% i$ k% A4 Q+ [! E其中基础研究主要有药物基因组学、医学基础研究、生物学基础研究、微生物宏基因组学等;上游主要是测序设备、耗材及试剂的研发;中游按照疾病诊断的流程分为疾病预防与早筛、辅助疾病诊断和药物伴随诊断;数据服务包括基因数据存储、分析和解读等;下游应用端主要为科研机构、医疗机构、药企、第三方检验中心和个人消费者。
& U* x! h" Y0 w c3 ^( o' c8 d/ n" ?
& ~( V* b0 k* r2 [
8 F' m- Y/ h- ^# b
" c/ L4 w+ {1 j9 k
( l. @; S& R4 S4 L7 p
8 F& g) _, K, b) C6 Z. p: w1 D( Y) n# F* A
. |% c2 ~9 d7 k/ E; j9 ~# ]0 ^8 f0 m9 k* ?3 _; Y
上游领域,目前的测序技术还停留在二代测序,部分已经使用三代测序技术。整个市场被国外基因检测仪器开发商Illumina长期处于垄断地位,国内主要是华大基因占用一定市场率。
' b1 U I5 t+ d# M; {, Q( X! T) `* m
) o( p3 C& K/ _' Y& q3 i1 s/ J1 U5 l中游领域主要以基因组测序积累的数据为基础,应用场景为产前筛查、遗传病检测癌症早筛、药物分子筛选。国内市场以华大基因与贝瑞基因(贝瑞和康)为头,遥遥领先。同时有多家云计算,IT厂家提供IT技术基础,数据分析服务- W6 B/ m) ?: v% `0 ?9 h# x
( X2 Z6 B; O- L
下游领域包括:产前筛查、癌症基因检测等检测的需求人士、药厂、医院及科研机构。而目前,基因检测服务中以NIPT为代表的生育健康类服务占据了一半以上的市场,但NIPT市场华大基因和贝瑞和康已经形成垄断。0 |3 _* Z1 D7 Z' f! Y O% ~
6 p2 [+ O% o' Z) v$ k+ q
2 V* v7 t" z" d# q" c) f; I+ A* r9 i% n2 S& y) k8 u
1 l( f+ C8 |; Q0 u' f- F Z$ ~: Z( X: M% T- S3 O$ b% N
基因测序应用场景9 \ ^& d# j$ H B
8 [& ~6 a% z- ~% O: f; Z) p- B2 G. a* l; [" m
! z" u9 h& J7 G: W7 K, d, B
8 y. C# T- i5 R, ?
整体来说,目前基因行业的应用场景还是一片蓝海,有很多待需要开发的场景和业务,随着测序成本的降低,能应用的领域也越来越广。同时对IT技术的依赖也会越来越旺盛。$ ~, c6 \7 C: H- }
5 D' n$ D5 M+ F% e2 G N# @7 D, M) [( d
* {( w# F# D: q- r1 f1 R
|
zan
|