- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564628 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174611
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
基因测序行业解决方案8 M1 n2 T& h3 a# |! g5 k- P q
基因图被称为“上帝用以创造生命的语言”,但今天我们不谈上帝,不谈基因,我们谈谈基因在IT中的应用和现状。
9 G/ M7 ?6 K5 a( K2 L
$ ?: N! [# m# _" M9 ]8 H段同学的基因测序行业解决方案,非常不错,赞!推荐!
4 F8 e) S6 K1 w- ]: C& {: ^- V: ` ^( @! ^2 ]" @' H. s9 r$ y) [" Q2 y& @
+ V- X# v* U0 C* h- M0 d4 v2 _' N
近年来,基因行业快速发展,由原本的实验室内的科研项目逐步走向临床应用,计算模式从离线向在线演进,带动医疗和健康行业的发展的同时,也让基因行业迎来新时代。8 o3 c$ a# B6 M/ o3 b6 ^
! s0 D8 N: d2 u5 K基因行业IT现状
0 q! q6 O9 H+ k! {& a
2 Q1 J5 [1 B# n7 \' F
; t3 u) a+ L) ~5 o, M
( D; r3 b# r3 U8 N3 g9 h基因计算行业在现实中遇到了很多挑战,主要分为如下几部分:0 }/ q) u% l3 _
# m0 C" A/ W2 r1 y9 ~1、数据存储方面,由于基因测序技术的提升,测序成本降低。从最初的人类基因组开始细分扩展,目前已经涉及到肿瘤,遗传病检测。扩展到植物,远古生物,细菌,病毒,微生物的基因检测。因此数据种类和数据量是异常庞大,经常以PB为单位保存。6 \ X" P o( W& z, w
& |9 ~7 ?3 f2 o9 V) Y4 _5 `. k3 _2、数据计算方面,大规模样本的数据分析和挖掘需要海量计算资源,本地计算成本太高,扩容慢,收效更慢+ E8 i2 f, [* z# P2 S
, u7 E% N! {: |- I* w. Q J9 ^3、数据全球化,因为基因行业的特殊性,很多样本数据需要到当地采集,如果有数据共享,就需要一个全球化,多数据中心的支持
7 A& T% X. y' K% ?$ i5 L% G# O1 z+ E( ~4 q2 k# }
4、数据安全方面,基因数据相对比较隐私,但传统的基因公司IT能力较弱,安全措施不到位,防御能力很弱。* b. O. g+ Z! J/ M) ?
7 U, Y7 Z8 T: I1 n* L( w针对这些特点,我们很容易想到,云是一个很好的解决办法,为什么这么说?请听我细细道来:
* J' t! u& x! E" \0 h4 B/ N) n/ _' A
0 y1 F6 o+ f+ I6 Y
- b1 Y, _/ B- x& b- L# n2 M
( `% u, r+ |: M
5 D9 i1 ]' b6 ?2 ~) o: H. j
7 h% Q/ y4 k; v y r) j* p' q4 W, _1 [% a# M8 d2 i- E
& L, @) Z0 O4 L# S数据计算--云本身的弹性计算能满足基因数据的挖掘和分析,能用最少的时间计算出结果。减少了用户的部署环境,计算的时间成本。 I) A% D+ Q+ v1 e7 d
# [" s3 X M+ `) H6 D
数据存储—云平台能提供海量的数据存储,且存储的格式多样,一般的云平台能支持文件存储,对象存储,根据数据类型还能支持冷存储(或叫归档存储)。对于PB级的数据,冷存储能减少很多客户成本。
5 C( ?; R% M7 @ I6 ?" H& R: ~. U" R) p
. K; z; V* m! |- C. x! m, P7 b数据传输—测序仪产生的大量数据需要靠专线,裸光纤网络进行传输,如果数据量为PB级的,则可以使用寄送硬盘方式传送到云厂家的数据中心。
& c! ]- m; g9 ^" [7 A4 H
9 T2 o+ z1 Q; f! H; g' c数据安全—云平台本身的vpc的网络隔离,高防,数据加密等安全机制可以保证数据的安全性
6 Q& K1 _: f# P# t
& ~) \5 U" Q1 A8 C7 @2 H% P: }2 w a% K6 W, v6 {# N) l" ?! t
4 T0 j7 C( R0 F+ M% Y) Y# f
3 G+ C u' ~7 Z8 i: n0 G( w
基因行业的痛点8 n1 a A; K Z# k \& ]
6 `9 w$ T+ c3 [! f4 h# U+ ^; ?# y) ]1 X' a0 O5 W7 B6 x
以上说到了基因行业使用云的好处,现在说说基因行业遇到的痛点
j4 Q% ?5 Q" }' {
2 L) d3 q: @9 {3 C% k2 o基因行业产生的原始数据台庞大,动则PB以上,如果从本地传输到云端,使用公网不知道传输到何年何月,如果使用带宽10GB的裸光纤,传输1PB数据需要连续15天,这样的时间跨度没法接受,即使采用寄送硬盘方式,也是需要很大的时间,人力,财务成本。所以,怎么解决数据端传输的云端是第一步,目前只能从远端减少数据量(比如针对基因数据研发一套数据压缩算法). E% x5 m& @4 i
! [5 S/ _2 _: V- G大量基因数据存储在云端,从主观上可能存在数据泄露的可能,这个也是公有云的弊端之一' c6 a# I8 F9 k4 }( n
' x- g3 [# R8 ^基因行业盈利模式还是集中在基因测序的医院,个人,研发机构。国内除了华大等一批上市的领头羊以外,大批的中小型企业都处于寻找商业模式的阶段。
" ]9 `) o) Y0 [" b& E' ` q5 |8 Q& F+ `" A( I2 b) p
) a/ m, _! M/ i, {. |" u5 u* Y2 A
7 B- N. G0 J( l$ N/ ]( }基因测序产业链4 f$ k0 Q( D# |5 E N: J
% v+ \2 V8 m) s9 M4 Q
& d7 w- a! I0 A3 y3 E" ~: A
4 B$ m* |: e% Y* L6 P- H; D
, i0 j3 ^. _7 H9 i. h7 w Z# ?7 b7 v国内基因测序产业链分为基础研究、上游设备端、中游测序服务端、基因大数据服务和下游应用端8 w2 H( [, {6 y% X
4 H$ p( S3 _5 n其中基础研究主要有药物基因组学、医学基础研究、生物学基础研究、微生物宏基因组学等;上游主要是测序设备、耗材及试剂的研发;中游按照疾病诊断的流程分为疾病预防与早筛、辅助疾病诊断和药物伴随诊断;数据服务包括基因数据存储、分析和解读等;下游应用端主要为科研机构、医疗机构、药企、第三方检验中心和个人消费者。8 l M$ L! F& }) o3 g) u, [
! T8 k8 H2 Y8 C: O" J+ j& U0 [& k% Z+ @+ O8 ^4 j4 ]* F$ B- K
9 F) F( {8 i2 A- u- C) O v
5 n" `3 h2 u4 r8 B. u, k) M u- d& u' Y7 E: F
& W% g R) \; ]% d6 G6 d$ j
1 K" q4 O6 \* E, m8 q
9 l' }4 [9 n4 b$ _% k% C4 ]* t4 z
9 _0 i4 j( K0 A* q: @4 w, K3 @上游领域,目前的测序技术还停留在二代测序,部分已经使用三代测序技术。整个市场被国外基因检测仪器开发商Illumina长期处于垄断地位,国内主要是华大基因占用一定市场率。
- V0 y4 o/ ?4 D; G$ P; c' r5 r, H5 N' E. a
中游领域主要以基因组测序积累的数据为基础,应用场景为产前筛查、遗传病检测癌症早筛、药物分子筛选。国内市场以华大基因与贝瑞基因(贝瑞和康)为头,遥遥领先。同时有多家云计算,IT厂家提供IT技术基础,数据分析服务+ Y% x4 b+ X8 Q2 o) S& H5 }% I
, b' H3 c5 {5 D/ q4 B% i5 o
下游领域包括:产前筛查、癌症基因检测等检测的需求人士、药厂、医院及科研机构。而目前,基因检测服务中以NIPT为代表的生育健康类服务占据了一半以上的市场,但NIPT市场华大基因和贝瑞和康已经形成垄断。
2 X) V; I8 P6 o3 P7 x5 i- A
+ r3 P+ M, _# ?& {2 @% `
n5 @5 M4 t& g% e% L' D4 l+ n
- p+ d: G, d1 v0 v$ O
5 j# K/ w9 M/ G/ s, D1 Z6 o
/ b/ x2 |4 [% u基因测序应用场景! n3 m Y/ L# @% f, y' u
$ k3 \8 A5 X7 r7 l9 [7 K! d
0 ]( i$ t0 _ ]1 K2 q* J5 ?- N
# W" a! i* S t7 s/ l# W% p! b3 U; |( f& j& r3 \; f
整体来说,目前基因行业的应用场景还是一片蓝海,有很多待需要开发的场景和业务,随着测序成本的降低,能应用的领域也越来越广。同时对IT技术的依赖也会越来越旺盛。: \& P& c ?1 x: F
! P. |6 y/ L: G& r0 L- _5 U
& D5 \: x# k- B* ~& k( [, T
' @; d" a( d i# S3 \4 p |
zan
|