- 在线时间
- 1630 小时
- 最后登录
- 2024-1-29
- 注册时间
- 2017-5-16
- 听众数
- 82
- 收听数
- 1
- 能力
- 120 分
- 体力
- 564695 点
- 威望
- 12 点
- 阅读权限
- 255
- 积分
- 174631
- 相册
- 1
- 日志
- 0
- 记录
- 0
- 帖子
- 5313
- 主题
- 5273
- 精华
- 3
- 分享
- 0
- 好友
- 163
TA的每日心情 | 开心 2021-8-11 17:59 |
|---|
签到天数: 17 天 [LV.4]偶尔看看III 网络挑战赛参赛者 网络挑战赛参赛者 - 自我介绍
- 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
 群组: 2018美赛大象算法课程 群组: 2018美赛护航培训课程 群组: 2019年 数学中国站长建 群组: 2019年数据分析师课程 群组: 2018年大象老师国赛优 |
基因测序行业解决方案
F% }8 n) _6 ~. n3 }, k+ M基因图被称为“上帝用以创造生命的语言”,但今天我们不谈上帝,不谈基因,我们谈谈基因在IT中的应用和现状。
/ J/ ~+ v# l" ?5 @. n! ] u8 K* {2 g7 D
段同学的基因测序行业解决方案,非常不错,赞!推荐!
2 N/ E2 f+ {; e8 z- h6 f, V* K5 I/ e) u: `
/ ]+ @( o7 d/ r, \2 e p
近年来,基因行业快速发展,由原本的实验室内的科研项目逐步走向临床应用,计算模式从离线向在线演进,带动医疗和健康行业的发展的同时,也让基因行业迎来新时代。
3 |$ g: J/ Q4 b& R. u; ?$ c& T- D" Z0 _/ ?7 y5 V, O- X
基因行业IT现状: I9 ~* Q4 H* B3 G$ _
* m: q8 w' q: P* A6 l
2 {/ X7 c+ q) |. N4 c
+ _" Y3 ?# S1 r" G基因计算行业在现实中遇到了很多挑战,主要分为如下几部分:! v) ^) s9 h, p1 O1 e! f8 i) G+ e
' b3 {4 T1 u4 A! n% I) A& q1、数据存储方面,由于基因测序技术的提升,测序成本降低。从最初的人类基因组开始细分扩展,目前已经涉及到肿瘤,遗传病检测。扩展到植物,远古生物,细菌,病毒,微生物的基因检测。因此数据种类和数据量是异常庞大,经常以PB为单位保存。
& j0 M; e0 q# |! W( R% k
* R- M% \; S, S/ L2、数据计算方面,大规模样本的数据分析和挖掘需要海量计算资源,本地计算成本太高,扩容慢,收效更慢
6 @- F9 ?" H* S9 P
% F u% e, S8 `& f% y1 l: d2 S3、数据全球化,因为基因行业的特殊性,很多样本数据需要到当地采集,如果有数据共享,就需要一个全球化,多数据中心的支持9 u) X) F7 F" g+ u( K
! V9 B, M. e4 |9 V# c( ]4、数据安全方面,基因数据相对比较隐私,但传统的基因公司IT能力较弱,安全措施不到位,防御能力很弱。
% X9 r/ U, T" C7 L5 d/ K6 j. n9 J8 t& j s8 t, J
针对这些特点,我们很容易想到,云是一个很好的解决办法,为什么这么说?请听我细细道来:
6 \+ x1 y# m0 a9 D: o+ x T' h' X) S# Z/ x6 K
( O8 R- k( Q4 U
# A( c- ~& o' ?$ s
+ c+ b' @/ A$ S; u$ C% H6 _ R+ X
0 H8 j' e& O* y* H* V2 t+ N4 V6 H3 ~+ G' B5 s' N a2 h& T$ e
% V( C7 Q6 D$ H
" k5 |! S6 n6 b5 Z数据计算--云本身的弹性计算能满足基因数据的挖掘和分析,能用最少的时间计算出结果。减少了用户的部署环境,计算的时间成本。' l M& v. N& z6 _: N
9 k( Q7 {. ?$ E# R$ S
数据存储—云平台能提供海量的数据存储,且存储的格式多样,一般的云平台能支持文件存储,对象存储,根据数据类型还能支持冷存储(或叫归档存储)。对于PB级的数据,冷存储能减少很多客户成本。; m5 L; k2 q% j: t9 |4 G
; v& |* L% f: N" G数据传输—测序仪产生的大量数据需要靠专线,裸光纤网络进行传输,如果数据量为PB级的,则可以使用寄送硬盘方式传送到云厂家的数据中心。/ K! j' q7 P# C V7 @1 {
/ Z$ K: R* L* |" a% p5 B5 v) D
数据安全—云平台本身的vpc的网络隔离,高防,数据加密等安全机制可以保证数据的安全性
- H, l' Z7 o5 X& X2 |" \0 X: I8 [3 B
* o, {3 l! m4 {& V' o9 k6 |' e6 n1 {6 \; e/ y2 C
( [( u# Q# j, n3 d, N
基因行业的痛点
4 f+ B7 r! Q; {5 @9 \( Y9 z4 S& F" s
7 T1 l. A f' a# ~/ M9 ~
以上说到了基因行业使用云的好处,现在说说基因行业遇到的痛点
5 o5 z! z* a8 T* }
. S" c, ]1 T9 c0 j. _3 g# f- L基因行业产生的原始数据台庞大,动则PB以上,如果从本地传输到云端,使用公网不知道传输到何年何月,如果使用带宽10GB的裸光纤,传输1PB数据需要连续15天,这样的时间跨度没法接受,即使采用寄送硬盘方式,也是需要很大的时间,人力,财务成本。所以,怎么解决数据端传输的云端是第一步,目前只能从远端减少数据量(比如针对基因数据研发一套数据压缩算法), R j# }' s+ ~' }1 S
3 _, o# q2 c3 o% {, z7 e- v% n+ a大量基因数据存储在云端,从主观上可能存在数据泄露的可能,这个也是公有云的弊端之一0 z! `3 ~, b2 D1 e* B
! n. r( ]' r% L2 n8 o- x基因行业盈利模式还是集中在基因测序的医院,个人,研发机构。国内除了华大等一批上市的领头羊以外,大批的中小型企业都处于寻找商业模式的阶段。$ j; t" v# j& G7 i: S9 S4 r
3 M4 C, `* r6 }
7 Z3 N/ {0 |: v7 t) n" [' w G9 K; F+ X8 K) P; L
基因测序产业链
2 n& c7 J. v7 _5 s, F7 U( y [# P
8 X/ D* |4 @) l+ y% |, V" C. |
9 x# x, I3 I7 v/ z" l' w' o7 N- C4 Z& V# D* K6 F
) S% v. p' q" S" {7 k/ B
国内基因测序产业链分为基础研究、上游设备端、中游测序服务端、基因大数据服务和下游应用端+ V3 P" C8 t1 `4 w# B6 [0 _* C9 }0 K) N
2 Z8 n, J' x* E( K5 G$ [3 K1 }* ?6 c
其中基础研究主要有药物基因组学、医学基础研究、生物学基础研究、微生物宏基因组学等;上游主要是测序设备、耗材及试剂的研发;中游按照疾病诊断的流程分为疾病预防与早筛、辅助疾病诊断和药物伴随诊断;数据服务包括基因数据存储、分析和解读等;下游应用端主要为科研机构、医疗机构、药企、第三方检验中心和个人消费者。" {5 m& d6 g* [. N
F+ _! r1 z$ d/ o8 L
* U# |/ `7 q) v b5 |1 P: O. ?( I% p& U( ^
5 I0 G6 ~9 E. a
; [' w" p) m6 R6 M* n, v
/ N+ p ]% J% z% Y3 y/ k+ N$ i" S7 U, Z. r
# Y5 r( b" g* T1 j6 S( x# g7 k: s3 S7 \0 H) }% R' T
上游领域,目前的测序技术还停留在二代测序,部分已经使用三代测序技术。整个市场被国外基因检测仪器开发商Illumina长期处于垄断地位,国内主要是华大基因占用一定市场率。
5 a; g& v5 ~2 \+ p5 Q) x
2 O- v8 F0 p ~中游领域主要以基因组测序积累的数据为基础,应用场景为产前筛查、遗传病检测癌症早筛、药物分子筛选。国内市场以华大基因与贝瑞基因(贝瑞和康)为头,遥遥领先。同时有多家云计算,IT厂家提供IT技术基础,数据分析服务1 v Q! d* z* o0 j w" A
4 r8 T" T5 I& x下游领域包括:产前筛查、癌症基因检测等检测的需求人士、药厂、医院及科研机构。而目前,基因检测服务中以NIPT为代表的生育健康类服务占据了一半以上的市场,但NIPT市场华大基因和贝瑞和康已经形成垄断。5 ?9 e. I; a# f
- W8 c: w& o7 g/ {( t6 F% B! J
3 a+ g, @( E, _" C
; J* P3 p6 a# K: D2 q: B7 L0 L, y E9 A+ E# d0 H0 z- `
1 ~6 O/ M9 Q5 P/ V+ D; Y
基因测序应用场景
/ w$ I; q E& k' e8 q g+ ^! `7 z& ?# C
7 K" C, x+ Z! L/ u( v9 z7 W3 D2 o, z( g0 e) r
, Y K; k0 x8 j$ I7 T/ p! }0 ^1 [, G3 \* Y8 v4 ^) a
整体来说,目前基因行业的应用场景还是一片蓝海,有很多待需要开发的场景和业务,随着测序成本的降低,能应用的领域也越来越广。同时对IT技术的依赖也会越来越旺盛。7 K5 t: m5 k: Y
+ b4 s+ l$ n7 ]& ]& s1 I/ _& J+ f5 E8 |2 J( y3 a N {( [
5 W$ t5 k5 I6 G$ ^ |
zan
|