QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2205|回复: 0
打印 上一主题 下一主题

基因测序行业解决方案

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-4-21 14:53 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    基因测序行业解决方案: [" u2 v, w3 _5 L: u" f
    基因图被称为“上帝用以创造生命的语言”,但今天我们不谈上帝,不谈基因,我们谈谈基因在IT中的应用和现状。& D6 b$ [7 w" |8 p5 F) Z8 Z
    ) g4 }! ~  x7 x" q9 ?
    段同学的基因测序行业解决方案,非常不错,赞!推荐!
    ; |9 h7 K/ t4 k. A, s$ g" |/ f3 S9 d- T" M7 U) A- Q5 b) p: L

    ( u* D; d5 T1 H. _$ A$ z近年来,基因行业快速发展,由原本的实验室内的科研项目逐步走向临床应用,计算模式从离线向在线演进,带动医疗和健康行业的发展的同时,也让基因行业迎来新时代。* e" v6 i! T9 O. [: A
    / t! F* t/ Q5 l) W; z! a4 _
    基因行业IT现状/ A8 [) M3 n% J. h, r7 x( {
    0 l6 i+ c" Y( ?

    8 a- `. y6 J7 d# d. c! _' Z0 q
    % b$ }# }" z7 s; E基因计算行业在现实中遇到了很多挑战,主要分为如下几部分:
    - U+ y$ N, U5 f4 b1 S2 m# ]/ r
    1、数据存储方面,由于基因测序技术的提升,测序成本降低。从最初的人类基因组开始细分扩展,目前已经涉及到肿瘤,遗传病检测。扩展到植物,远古生物,细菌,病毒,微生物的基因检测。因此数据种类和数据量是异常庞大,经常以PB为单位保存。
    - e0 N5 n5 X7 d3 P/ x! |1 G& A6 r( M/ ^1 e" K" b9 ^
    2、数据计算方面,大规模样本的数据分析和挖掘需要海量计算资源,本地计算成本太高,扩容慢,收效更慢
      g& O/ M  Z: s" a7 V& N
    ; m: P2 t2 |# \3、数据全球化,因为基因行业的特殊性,很多样本数据需要到当地采集,如果有数据共享,就需要一个全球化,多数据中心的支持! ?: ], G4 m1 p& P' u$ ?" K& m
    , o0 W- d) W+ T' A
    4、数据安全方面,基因数据相对比较隐私,但传统的基因公司IT能力较弱,安全措施不到位,防御能力很弱。
    & K" a1 S- d0 |$ K, m1 J9 \3 ]; C2 A) I2 n" X& W6 _
    针对这些特点,我们很容易想到,云是一个很好的解决办法,为什么这么说?请听我细细道来:
    : I) C7 f( W* ?7 ?9 x
    / i  [# s& J" f8 L$ l3 C) N6 \9 n' M. _2 K* m4 u

      l: m: l" w- ^/ K+ X5 E
      @2 b. J+ u* @1 \2 T' r( [4 Y7 U. Z
    , C+ j" N; P5 [* {- H6 ]% @" t
    + H5 h9 Y1 h; _( V
    + z- E8 x- a* V
    1 N. L, f& @$ M2 `+ o数据计算--云本身的弹性计算能满足基因数据的挖掘和分析,能用最少的时间计算出结果。减少了用户的部署环境,计算的时间成本。
    2 X8 S" J7 \5 U
    2 b0 V+ |7 ?0 E' |数据存储—云平台能提供海量的数据存储,且存储的格式多样,一般的云平台能支持文件存储,对象存储,根据数据类型还能支持冷存储(或叫归档存储)。对于PB级的数据,冷存储能减少很多客户成本。& [; i9 p+ J- B9 ?8 O1 l4 @% f/ O
    8 U: T5 l% Y& P) }( i2 Y# g
    数据传输—测序仪产生的大量数据需要靠专线,裸光纤网络进行传输,如果数据量为PB级的,则可以使用寄送硬盘方式传送到云厂家的数据中心。8 D& n/ f2 a8 Q% V

    . X( L7 e2 K! A( E* j* V  ~数据安全—云平台本身的vpc的网络隔离,高防,数据加密等安全机制可以保证数据的安全性
    ! _8 `' ?/ k) W/ m4 o/ p0 O7 T0 ^" C# \3 P3 E* H1 {, R0 U  P; z
    2 ^6 \. y% }& ?- u

    $ R6 P4 J: o% c# u& @7 U( U" \( Z* }9 Z
    基因行业的痛点( V  c( y9 q4 Y- [6 A) h, t  a

    8 Y# Y; @, i# W( j
    7 }7 N6 `7 `& |% t/ D* Y以上说到了基因行业使用云的好处,现在说说基因行业遇到的痛点
    " c: K) l/ |% E+ f8 _' H
    ! ]8 D; D6 _3 |9 x  ~; P: z基因行业产生的原始数据台庞大,动则PB以上,如果从本地传输到云端,使用公网不知道传输到何年何月,如果使用带宽10GB的裸光纤,传输1PB数据需要连续15天,这样的时间跨度没法接受,即使采用寄送硬盘方式,也是需要很大的时间,人力,财务成本。所以,怎么解决数据端传输的云端是第一步,目前只能从远端减少数据量(比如针对基因数据研发一套数据压缩算法)* ~: k: t# O) ?* ^
    6 G4 ~( h' N  f* \: z1 E
    大量基因数据存储在云端,从主观上可能存在数据泄露的可能,这个也是公有云的弊端之一
    1 \% Y4 P$ c( D$ c$ r/ U: A* o; E# W; [& U8 M( J3 Y
    基因行业盈利模式还是集中在基因测序的医院,个人,研发机构。国内除了华大等一批上市的领头羊以外,大批的中小型企业都处于寻找商业模式的阶段。
    8 S, J1 p$ I0 r5 d& i3 K. [+ W+ T" H0 j3 w

    ) R0 l8 e3 g# h* A3 L( U" p6 \! M; a# k  J* ^
    基因测序产业链
    9 j6 V4 B) W) d1 k2 n6 C/ O/ H; L6 O" s# s0 ]& E) c
    5 m, c1 n2 x7 F" o; U' H

    1 O: s. U. E2 t& w3 T8 ~$ Y) R" A) Z/ l6 @% k' E( f
    国内基因测序产业链分为基础研究、上游设备端、中游测序服务端、基因大数据服务和下游应用端8 S$ j0 J$ o2 [% S2 Q; B
    4 a. s* z; A; o
    其中基础研究主要有药物基因组学、医学基础研究、生物学基础研究、微生物宏基因组学等;上游主要是测序设备、耗材及试剂的研发;中游按照疾病诊断的流程分为疾病预防与早筛、辅助疾病诊断和药物伴随诊断;数据服务包括基因数据存储、分析和解读等;下游应用端主要为科研机构、医疗机构、药企、第三方检验中心和个人消费者。
    ! K( c% L9 s1 V
    : `) P9 a1 i* u" A. i% Q0 x! l" t/ E9 [

    & d$ D( F. H; y8 M9 b3 r
    : w! U8 b6 l+ G, z' r$ Q" L. \
    + [% c% `8 P6 o
    , G. C. I) I* _  r
      E* [2 X5 C; T. z* g& Z  m3 `6 b0 i- }4 E
    6 d, n" {7 t, S
    上游领域,目前的测序技术还停留在二代测序,部分已经使用三代测序技术。整个市场被国外基因检测仪器开发商Illumina长期处于垄断地位,国内主要是华大基因占用一定市场率。! T. r% ]/ Z" Z2 b# G/ H

    + j+ e3 B6 P7 U& |( f中游领域主要以基因组测序积累的数据为基础,应用场景为产前筛查、遗传病检测癌症早筛、药物分子筛选。国内市场以华大基因与贝瑞基因(贝瑞和康)为头,遥遥领先。同时有多家云计算,IT厂家提供IT技术基础,数据分析服务5 [! w* W" l( t: q5 X

    * R% o' l' e* U! X! j: Q, X) F下游领域包括:产前筛查、癌症基因检测等检测的需求人士、药厂、医院及科研机构。而目前,基因检测服务中以NIPT为代表的生育健康类服务占据了一半以上的市场,但NIPT市场华大基因和贝瑞和康已经形成垄断。
    3 ^: n- c" H8 z9 E1 D4 D5 A( V0 L& b) Y, b' l* Q- {4 u& ^
    " a$ f5 J0 J8 F. U5 c( z; [) }
    $ v1 E. J: g5 d. P' Q

    9 q6 X: t  E" s! P4 o; @2 t
    ' f* R' a% o0 k2 j7 E基因测序应用场景+ y1 ~+ o1 b' v
    $ E8 G3 s2 T- `4 [
    ! ^( c) C% x' k$ r0 \, A* z

    . c& c8 |. E% j7 T) T9 a' }
    . A7 I6 c% R0 ]9 `! }. g整体来说,目前基因行业的应用场景还是一片蓝海,有很多待需要开发的场景和业务,随着测序成本的降低,能应用的领域也越来越广。同时对IT技术的依赖也会越来越旺盛。7 a; u  d& j/ r+ _

    / @  G: P9 I; Y7 k( L' _6 c( I& L1 O
    + j# c4 S/ F+ n: ?3 R3 [4 |+ L1 v. n2 x- S0 X

    数学建模解题思路与方法.pptx

    117.69 KB, 下载次数: 7, 下载积分: 体力 -2 点

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-19 16:29 , Processed in 0.475286 second(s), 54 queries .

    回顶部