+ k: y' v( W) C0 @0 _6 Y c针对这些特点,我们很容易想到,云是一个很好的解决办法,为什么这么说?请听我细细道来:' c/ _, R0 F# L1 I
9 r5 B* r7 P( l' G' C6 z$ }( G7 s) j* j: D
# `% z/ X& z1 o' i8 C9 W8 K# k& {* `
3 W4 f: ]: P. M' E( d' e: o! q! s, x( l
# v# c4 c9 P$ F% G$ G, e/ S ; |4 W4 ?2 ^3 k- q4 p5 v6 M( | C% m6 q) A+ s
数据计算--云本身的弹性计算能满足基因数据的挖掘和分析,能用最少的时间计算出结果。减少了用户的部署环境,计算的时间成本。; o- ~ t: {; r8 Y; q. H1 ?& M
8 C1 U- r7 N. {! u$ W
数据存储—云平台能提供海量的数据存储,且存储的格式多样,一般的云平台能支持文件存储,对象存储,根据数据类型还能支持冷存储(或叫归档存储)。对于PB级的数据,冷存储能减少很多客户成本。1 N& L& R' M: X+ b
/ n& ]1 ~* }) d2 x数据传输—测序仪产生的大量数据需要靠专线,裸光纤网络进行传输,如果数据量为PB级的,则可以使用寄送硬盘方式传送到云厂家的数据中心。; B- S6 r5 Z, k; y7 w2 N
; M1 ?% H! V! M z i
数据安全—云平台本身的vpc的网络隔离,高防,数据加密等安全机制可以保证数据的安全性 7 k e. M0 y+ F1 X) C5 h0 p" i% k: `( E; y. Z) g" y
7 u0 Y3 T# q0 f, ]" c, ~9 I8 L 5 z/ q K# w& V ! f" k7 s" v7 \基因行业的痛点 . \& g. ?. k6 s) m& ]; {* N) b 7 q# A* D, ~9 |3 K1 a. T 8 Q* o6 q2 }0 D' Q8 r, _0 F& R* B以上说到了基因行业使用云的好处,现在说说基因行业遇到的痛点 $ Q; w( ^: @( i- u( X4 k" Z0 f8 [9 w3 h, ^; Q3 n
基因行业产生的原始数据台庞大,动则PB以上,如果从本地传输到云端,使用公网不知道传输到何年何月,如果使用带宽10GB的裸光纤,传输1PB数据需要连续15天,这样的时间跨度没法接受,即使采用寄送硬盘方式,也是需要很大的时间,人力,财务成本。所以,怎么解决数据端传输的云端是第一步,目前只能从远端减少数据量(比如针对基因数据研发一套数据压缩算法)0 q9 B2 ~) Q8 S% r1 v* t