- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 563425 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174250
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
基因测序行业解决方案; T# Y8 F4 h! e6 S8 d4 [$ @9 N+ ~# m
基因图被称为“上帝用以创造生命的语言”,但今天我们不谈上帝,不谈基因,我们谈谈基因在IT中的应用和现状。7 d4 |! `8 ?5 H
( t1 D! z+ D$ h6 t段同学的基因测序行业解决方案,非常不错,赞!推荐!5 u5 h# r0 S4 M1 R9 \# R1 ^7 S S
3 J7 b; H. P% f! [- ^% \6 B! e
# ~4 @8 u$ S1 Q( N0 x6 I
近年来,基因行业快速发展,由原本的实验室内的科研项目逐步走向临床应用,计算模式从离线向在线演进,带动医疗和健康行业的发展的同时,也让基因行业迎来新时代。
, _/ U4 V; B" Z* h' g% l
, P$ B$ M) P" Q. t( \* l+ G. g) M0 V% p基因行业IT现状( k+ ?& N& X! v
, `# v: x7 [4 q% `0 J* L5 g
$ {$ d* R$ D4 K: v
" @" o0 C' h4 x( K' g4 j% p基因计算行业在现实中遇到了很多挑战,主要分为如下几部分:
, G$ R# B8 t/ f/ r) s8 U
6 l# f" s; s/ c3 y# m3 l1、数据存储方面,由于基因测序技术的提升,测序成本降低。从最初的人类基因组开始细分扩展,目前已经涉及到肿瘤,遗传病检测。扩展到植物,远古生物,细菌,病毒,微生物的基因检测。因此数据种类和数据量是异常庞大,经常以PB为单位保存。
& a! w: }# x/ ?) o# L* ^- Z+ l8 F# w" G" L2 _' u4 A
2、数据计算方面,大规模样本的数据分析和挖掘需要海量计算资源,本地计算成本太高,扩容慢,收效更慢
/ P8 F5 k+ U! s
d: J6 s( A& p" u6 F' Q3、数据全球化,因为基因行业的特殊性,很多样本数据需要到当地采集,如果有数据共享,就需要一个全球化,多数据中心的支持
6 u' Z y7 P0 L% z0 n
* [# I( `9 h6 e& I2 @- g4、数据安全方面,基因数据相对比较隐私,但传统的基因公司IT能力较弱,安全措施不到位,防御能力很弱。/ h' R8 f6 e: k) U, K, J
# K2 ^' b& Z! e9 u) T2 D4 L/ x5 z针对这些特点,我们很容易想到,云是一个很好的解决办法,为什么这么说?请听我细细道来:. n8 n8 V6 L7 e9 d. Z! h5 `2 n6 G
' ]% T z) ?! C W. e! d w- D
+ V& P" n; m- f6 X2 `: U5 Q$ F2 h* d
5 S7 n8 E9 s/ \) f I; V! {
% z9 I+ V4 }6 t j% u& Q5 Y; o+ i: X/ K' B
: h1 Y2 N k( r. t4 g' `. e" C
5 q& h! M) m, k6 E4 x
+ l0 b7 ~" u' `. _% p$ Y数据计算--云本身的弹性计算能满足基因数据的挖掘和分析,能用最少的时间计算出结果。减少了用户的部署环境,计算的时间成本。0 x) k4 b" s! S* f( Y9 r$ ~
( c9 g# u; O5 d' o# Z8 _
数据存储—云平台能提供海量的数据存储,且存储的格式多样,一般的云平台能支持文件存储,对象存储,根据数据类型还能支持冷存储(或叫归档存储)。对于PB级的数据,冷存储能减少很多客户成本。
5 }. _& c- O& I4 D
+ j3 \5 @. U) X: e i8 `& I6 c3 L数据传输—测序仪产生的大量数据需要靠专线,裸光纤网络进行传输,如果数据量为PB级的,则可以使用寄送硬盘方式传送到云厂家的数据中心。" J+ b8 c; N/ @: E
# R5 z ]9 `4 P/ S
数据安全—云平台本身的vpc的网络隔离,高防,数据加密等安全机制可以保证数据的安全性; O% y3 K+ v/ J- P
6 \3 a! z- [! M3 [
0 A) ?# }1 Q9 G0 J9 A
& F0 t' X( l4 _3 u8 V5 X" V( z I, Y) J# _7 N+ i! W; K
基因行业的痛点7 W; y& t) w+ T* }/ W' R ^# B
# H9 ^0 w9 A% O h1 w$ e6 @) m# v6 t e7 a& r' q, S2 w: h
以上说到了基因行业使用云的好处,现在说说基因行业遇到的痛点
) F: x# f+ I7 t
" d' E. p& n; d2 _+ K2 \2 t基因行业产生的原始数据台庞大,动则PB以上,如果从本地传输到云端,使用公网不知道传输到何年何月,如果使用带宽10GB的裸光纤,传输1PB数据需要连续15天,这样的时间跨度没法接受,即使采用寄送硬盘方式,也是需要很大的时间,人力,财务成本。所以,怎么解决数据端传输的云端是第一步,目前只能从远端减少数据量(比如针对基因数据研发一套数据压缩算法)# H$ `, G: R L/ a, ]) I6 m
5 S) D$ Z- r2 t% ^, t, g8 ?5 R
大量基因数据存储在云端,从主观上可能存在数据泄露的可能,这个也是公有云的弊端之一( ^& R. l8 d0 a/ z$ {
5 s4 T7 _4 z/ o8 H# a7 w- X! N8 }
基因行业盈利模式还是集中在基因测序的医院,个人,研发机构。国内除了华大等一批上市的领头羊以外,大批的中小型企业都处于寻找商业模式的阶段。. L/ v$ B0 t8 D* ]4 y7 |
/ B1 A& q6 Q6 x
) W* F. x* d* B6 v
: r( I$ x- V. p R4 h# l/ B
基因测序产业链
3 d0 s1 [ N. \" v, Q% e9 H! d( q- `1 m6 e6 |1 F
1 T2 r; O \7 D7 w+ w6 [- L5 }
! E. h% c6 {, D1 V8 V: O0 z# x. c; o. {& e+ j6 d; r4 \% Z
国内基因测序产业链分为基础研究、上游设备端、中游测序服务端、基因大数据服务和下游应用端) q; _6 c, u' }( K
# @' U+ \* P, J1 @5 y其中基础研究主要有药物基因组学、医学基础研究、生物学基础研究、微生物宏基因组学等;上游主要是测序设备、耗材及试剂的研发;中游按照疾病诊断的流程分为疾病预防与早筛、辅助疾病诊断和药物伴随诊断;数据服务包括基因数据存储、分析和解读等;下游应用端主要为科研机构、医疗机构、药企、第三方检验中心和个人消费者。
& G" q& w& x9 n7 y- h2 L
+ X' }# u. j+ _
- K8 I* V$ J/ K) c: }# g* A3 U) f& S2 }2 ~
3 z2 P j5 U1 ^+ n5 E0 `9 L* L/ K
* f: l. N0 w' D
' ]" ^% n9 X* J* N% ?6 V) p
9 t) M. g9 a! m7 n3 d* m% ] y
( h* P9 }# H3 i# `" z+ s+ y3 }2 a6 I c4 H) a3 Y4 ~
上游领域,目前的测序技术还停留在二代测序,部分已经使用三代测序技术。整个市场被国外基因检测仪器开发商Illumina长期处于垄断地位,国内主要是华大基因占用一定市场率。
. C D2 x. Z$ s
& Q% b3 t( Q+ t) j s: T" L6 X中游领域主要以基因组测序积累的数据为基础,应用场景为产前筛查、遗传病检测癌症早筛、药物分子筛选。国内市场以华大基因与贝瑞基因(贝瑞和康)为头,遥遥领先。同时有多家云计算,IT厂家提供IT技术基础,数据分析服务
4 ?" n6 u2 ~! A1 G$ J3 Z- Y
' X g) k9 \6 A% h$ U& L9 I6 l. E下游领域包括:产前筛查、癌症基因检测等检测的需求人士、药厂、医院及科研机构。而目前,基因检测服务中以NIPT为代表的生育健康类服务占据了一半以上的市场,但NIPT市场华大基因和贝瑞和康已经形成垄断。' y7 I+ M& q+ Q# g! d0 ?5 o0 `/ _
/ @6 q0 F. e& D# I6 ^1 f5 O: \- q% y0 q- x. g; V% V+ @- g' t8 I9 K& P& C
' r% t& B* K" x( |
0 x3 X# q; Y* e- n1 {$ A% V4 U
: X. h; t/ c4 c! L基因测序应用场景' d1 c+ E0 b3 k5 F; q. c5 m/ J
8 {2 L" E. m8 i% b/ I# D. q' o# R9 d- Q
1 a2 z" C5 k( z _* `$ Q5 z8 [0 U
7 ]! W7 B- D8 D' z% P
整体来说,目前基因行业的应用场景还是一片蓝海,有很多待需要开发的场景和业务,随着测序成本的降低,能应用的领域也越来越广。同时对IT技术的依赖也会越来越旺盛。) R8 j/ P9 U" G2 ~* O H% v
) ^9 q- a( e( d; I! v% y+ T" b, r& Q
: I" u. k& p( y/ v8 U; X6 |6 G' t) i
% C r$ I0 @0 d O
|
zan
|