在线时间 1630 小时 最后登录 2024-1-29 注册时间 2017-5-16 听众数 82 收听数 1 能力 120 分 体力 563392 点 威望 12 点 阅读权限 255 积分 174240 相册 1 日志 0 记录 0 帖子 5313 主题 5273 精华 3 分享 0 好友 163
TA的每日心情 开心 2021-8-11 17:59
签到天数: 17 天
[LV.4]偶尔看看III
网络挑战赛参赛者
网络挑战赛参赛者
自我介绍 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
群组 : 2018美赛大象算法课程
群组 : 2018美赛护航培训课程
群组 : 2019年 数学中国站长建
群组 : 2019年数据分析师课程
群组 : 2018年大象老师国赛优
基因测序行业解决方案 7 D5 Z# v; m8 @' K8 U3 A
基因图被称为“上帝用以创造生命的语言”,但今天我们不谈上帝,不谈基因,我们谈谈基因在IT中的应用和现状。
" K* s2 ^0 _" `: V* a& \! |
; t9 t) y! i- f# f9 K5 T 段同学的基因测序行业解决方案,非常不错,赞!推荐!
/ f( |1 x# S4 j' ` ' S" |7 u1 ~& S# @ `0 k
% W5 t- p/ a3 M 近年来,基因行业快速发展,由原本的实验室内的科研项目逐步走向临床应用,计算模式从离线向在线演进,带动医疗和健康行业的发展的同时,也让基因行业迎来新时代。6 s: u, J) y P8 N) C; |, ~
' y( K- G2 ?# u0 G
基因行业IT现状* v V" G- a) d; c
/ l1 {) C7 _2 O! i' O! n ! D! v) [. K) P- |# _( A. a7 K4 t) J
5 @/ h9 Q* e* m/ q5 T$ F) t
基因计算行业在现实中遇到了很多挑战,主要分为如下几部分:# Y- d: g) n1 g# y. p, ]1 B
7 f3 {- l* J4 p+ Q" J2 x: {7 ^
1、数据存储方面,由于基因测序技术的提升,测序成本降低。从最初的人类基因组开始细分扩展,目前已经涉及到肿瘤,遗传病检测。扩展到植物,远古生物,细菌,病毒,微生物的基因检测。因此数据种类和数据量是异常庞大,经常以PB为单位保存。
. e; i1 t% N) v8 x3 i Z
( p9 n) z9 ]+ d- q" q7 F 2、数据计算方面,大规模样本的数据分析和挖掘需要海量计算资源,本地计算成本太高,扩容慢,收效更慢 c( @( |' A w9 R' `: O
; d% B" }# [/ _% V" R/ `3 R* i
3、数据全球化,因为基因行业的特殊性,很多样本数据需要到当地采集,如果有数据共享,就需要一个全球化,多数据中心的支持4 ?7 a/ G7 O4 \% f6 v- `
: y0 y# ]6 A& a* r) R 4、数据安全方面,基因数据相对比较隐私,但传统的基因公司IT能力较弱,安全措施不到位,防御能力很弱。& A# X! M i$ S3 A! c7 g' D# H
, j% z7 G. q! e 针对这些特点,我们很容易想到,云是一个很好的解决办法,为什么这么说?请听我细细道来:
) Q7 I5 \! z/ u' N; {# s; d 1 ?# C2 e/ l2 S# p% j
+ _* ?7 l) J+ }9 V3 `9 v & k8 n: N. ]: i& W9 z X0 A
& S! o# l! Q' w 2 c; G& ^+ R- l) X0 S9 s& [1 N
+ p- o1 {4 N( S4 K$ h& O0 o5 R
9 A7 [/ f: Q# v0 B0 t( C
) r+ r# @- p# E2 l+ t: T. S 数据计算--云本身的弹性计算能满足基因数据的挖掘和分析,能用最少的时间计算出结果。减少了用户的部署环境,计算的时间成本。
$ u1 T2 G( g* H3 j! ]
3 M) c3 [0 o2 s' V% |9 Q/ k 数据存储—云平台能提供海量的数据存储,且存储的格式多样,一般的云平台能支持文件存储,对象存储,根据数据类型还能支持冷存储(或叫归档存储)。对于PB级的数据,冷存储能减少很多客户成本。8 y& p3 s) F, Z
( ], S& d1 Y! S+ i* h: A* U1 R
数据传输—测序仪产生的大量数据需要靠专线,裸光纤网络进行传输,如果数据量为PB级的,则可以使用寄送硬盘方式传送到云厂家的数据中心。2 M) a* s, C; [5 L
' T. u6 x3 Q1 o/ h; c. s
数据安全—云平台本身的vpc的网络隔离,高防,数据加密等安全机制可以保证数据的安全性
. p m E# R2 a: e+ w # x1 y9 C7 o6 B
, D! T# V9 z3 F; u" i" i
( _, q% E: V' T( ]$ y0 ~8 U3 T
* X+ E$ q$ |# g. ^* M+ _/ c 基因行业的痛点
* u, y% R# [7 Z3 b/ C" i & m: ]/ J& \ A( {- V- Q
0 s! O) z9 w, j" F$ \
以上说到了基因行业使用云的好处,现在说说基因行业遇到的痛点; `8 Z* D. A" ] n$ G! }
$ m, m8 `6 o& x0 L( h2 _8 ]; S+ _, p 基因行业产生的原始数据台庞大,动则PB以上,如果从本地传输到云端,使用公网不知道传输到何年何月,如果使用带宽10GB的裸光纤,传输1PB数据需要连续15天,这样的时间跨度没法接受,即使采用寄送硬盘方式,也是需要很大的时间,人力,财务成本。所以,怎么解决数据端传输的云端是第一步,目前只能从远端减少数据量(比如针对基因数据研发一套数据压缩算法). z, b! T' j/ E: {4 X2 v8 x0 f
* J. Q5 z5 O* j4 S3 B" m. x 大量基因数据存储在云端,从主观上可能存在数据泄露的可能,这个也是公有云的弊端之一: W/ _( j1 c+ `/ N( a( d' }
8 Z1 ?9 b4 g; s, E- b% n# c$ N 基因行业盈利模式还是集中在基因测序的医院,个人,研发机构。国内除了华大等一批上市的领头羊以外,大批的中小型企业都处于寻找商业模式的阶段。
' {# C' z& C' _# v: K " h) y1 Y# y J% Y
e* H4 ]/ o! _: h1 G& j
+ ~: h7 ] D+ n2 n
基因测序产业链; p+ V4 B) V5 }( ^+ r. i
! ]/ Y v8 ^8 E4 k# Z
2 o3 h% _; e5 n2 {1 y
$ S" W% C4 V' v# z
* C- @# |' E V0 n& { 国内基因测序产业链分为基础研究、上游设备端、中游测序服务端、基因大数据服务和下游应用端
% T; f |- F* ~ r) O2 @ 3 w! H7 K2 A" P* ?1 p; ~; [( ^
其中基础研究主要有药物基因组学、医学基础研究、生物学基础研究、微生物宏基因组学等;上游主要是测序设备、耗材及试剂的研发;中游按照疾病诊断的流程分为疾病预防与早筛、辅助疾病诊断和药物伴随诊断;数据服务包括基因数据存储、分析和解读等;下游应用端主要为科研机构、医疗机构、药企、第三方检验中心和个人消费者。3 E; Q* t5 N' j; g3 r7 Z2 H
/ `+ K! G: K2 }( ? 1 R! n9 H' E1 K& J
7 _) s% w' _1 U+ }
% t4 b' ]- h R J
( q9 Z7 {( G0 M
2 f! G, z8 u/ {- x % q9 V2 ]* J: k& ~. w
( x$ V* y9 O2 \% P
1 u$ V% m p+ l) N! E 上游领域,目前的测序技术还停留在二代测序,部分已经使用三代测序技术。整个市场被国外基因检测仪器开发商Illumina长期处于垄断地位,国内主要是华大基因占用一定市场率。
) m0 ]. s: @6 R/ p6 D) Q
$ N5 o7 d; H' U, `7 t( ^ 中游领域主要以基因组测序积累的数据为基础,应用场景为产前筛查、遗传病检测癌症早筛、药物分子筛选。国内市场以华大基因与贝瑞基因(贝瑞和康)为头,遥遥领先。同时有多家云计算,IT厂家提供IT技术基础,数据分析服务
7 Q& g/ V" p u! T+ @3 X
, v4 t: P9 c! p% q0 D7 x 下游领域包括:产前筛查、癌症基因检测等检测的需求人士、药厂、医院及科研机构。而目前,基因检测服务中以NIPT为代表的生育健康类服务占据了一半以上的市场,但NIPT市场华大基因和贝瑞和康已经形成垄断。$ O# y" Y: k/ L5 ^) ~& l* b1 w& a$ n. b
' k% } c$ J/ w0 G / U, n* `9 G0 U1 r
" G! F, A7 ^1 F' d+ q* P
; i% T& q# ~) M* b6 e
0 u" e; u0 _* z" a5 c
基因测序应用场景0 p- P$ Y" b1 T2 v
5 r0 @4 u$ t3 z
0 P1 _& }5 `- h" o
- J7 J) O' {9 i, u1 h6 K8 M + g0 G5 J9 J9 N V ~: u* A0 V
整体来说,目前基因行业的应用场景还是一片蓝海,有很多待需要开发的场景和业务,随着测序成本的降低,能应用的领域也越来越广。同时对IT技术的依赖也会越来越旺盛。
" q$ R8 @/ Z$ k" ~. P - w0 G6 g. a( p
5 A) z1 i/ R" Y" Z0 f
# u" {" \- Q: D3 z6 D) [2 i
zan