QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 4770|回复: 10
打印 上一主题 下一主题

[2012A题优秀论文] DNA序列表示及基因识别方法研究

[复制链接]
字体大小: 正常 放大
madio        

3万

主题

1312

听众

5万

积分

  • TA的每日心情
    奋斗
    2024-7-1 22:21
  • 签到天数: 2014 天

    [LV.Master]伴坛终老

    自我介绍
    数学中国站长

    社区QQ达人 邮箱绑定达人 优秀斑竹奖 发帖功臣 风雨历程奖 新人进步奖 最具活力勋章

    群组数学建模培训课堂1

    群组数学中国美赛辅助报名

    群组Matlab讨论组

    群组2013认证赛A题讨论群组

    群组2013认证赛C题讨论群组

    跳转到指定楼层
    1#
    发表于 2013-7-30 05:09 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta |邮箱已经成功绑定
    题 目 DNA序列表示及基因识别方法研究
    # s4 k4 Q+ c8 c6 _! Q! V. z5 }摘 要: 本文就DNA序列表示及基因识别算法实现的相关问题进行了研究,取得了以下几方面的成果。 1. 功率谱与信噪比的快速算法
    7 s- ]( m, B  U6 [- j+ t" h6 K& Q$ e 针对Voss映射,给出了计算基因序列功率谱或信噪比的快速Fourier变换和AR模型,仿真实验结果表明,计算效率有所提升。经过理论推导,建立了功率谱、信噪比与DNA序列中核苷酸出现的频次之间的关系,即为SNR-F公式:9 F5 S; r& G5 V  x$ ]9 Q0 _5 }
    CGATACGTNNNNRRRRRNNNN 利用该公式,计算功率谱与信噪比将不再需要离散Fourier变换等计算量较大的运算,只需要对DNA序列中核苷酸出现的频次进行统计,然后进行简单的数值运算即可,有效提升了功率谱与信噪比的计算效率。
    4 |6 v1 E" O1 U% [ 推导出了Z-curve映射的功率谱与信噪比和Voss映射下的功率谱与信噪比之间的数值关系,即为:  Q2 w0 B- l. `5 Y: I6 q4 e7 \
    4zEE和zRR 并从理论基础、生物学意义和特征三个方面对Z-curve映射和Voss映射进行了对比分析,刻画出了两种映射之间更深层次、更全面的关系。
    : o/ W( p. m$ _( R 经过理论推导,给出了一般的实数映射下功率谱、信噪比的快速计算公式,将其功率谱、信噪比的计算简化为核苷酸出现频次的统计和简单数值运算,极大简化了实数映射下功率谱与信噪比的计算。
    + A+ ^( O) D/ R. W! A6 ]2. 对不同物种类型基因的阈值确定
    ( T* J1 E8 T" ]2
    ) U' R( Z8 y- S6 P  o6 v9 W: Q! } 本文结合重采样技术,提出了最佳阈值确定算法,能为每一个特定种类的生物推测其最佳阈值。模型能够针对不同生物基因的结构特征,启发式地为其推断出一个最佳的预测阈值。仿真实验结果表明,附件中所给的人和鼠类生物基因预测的最佳阈值为1.7773,200个哺乳动物类的基因预测的最佳阈值为2.18。在合理确定窗口大小的基础上,利用该最佳阈值能显著提高基于功率谱分析方法的基因预测精度,同时还可用来预测该生物目前尚未标注确认的其它基因。# V4 ?  t' Q2 }
    3. 基因识别算法的实现7 v, \, p5 i: ]7 P# _* G% _$ Z
     针对基因识别算法的设计与实现问题,本文首先利用基于AR模型重采样的基因预测方法对附件中给出的6个未被注释的DNA序列的编码区域进行了预测。然后,结合数字滤波器与信噪比快速计算公式,提出了一种基于SNR-F的基因识别模型。该模型克服了现有Fourier方法对DNA序列长度的限制,并且能够提高实现效率。最后,利用该模型对未被注释的DNA序列的编码区域进行了预测。两种预测方法相结合有助于提高基因预测的精度,同时使后期基因识别更具有针对性。! e. d% ~" s: L% S
    4. 延展性问题
    3 b2 @# m" l0 ]6 w( E; u8 `& q 针对目前常用的基因识别算法对特征选取的主观性,建立了基因识别特征的动态筛选模型。该模型在训练中充分选取基因的多类特征作为候选特征,构造编码区与非编码区的正负数据集,运用特征筛选方法在数据集中提取主特征,以达到优化特征集、减少冗余度的目的。同时,模型用组合向量的方式实现多类特征的融合,将序列转换成特征空间中的向量,通过利用判别分析的方法达到识别的目的。特征的筛选和组合提高了基因识别算法的合理性和信息利用率,预测精度达到了98%以上,高于已有算法的预测精度。1 }1 c7 |# f$ o& G0 n$ @) [# I% t6 c; ]
     Z-曲线的提出表明利用几何工具可以有效地分析DNA序列,受此启发,本文基于改进的基于DNA序列的“四线”图,提出了基于改进“四线”图的DNA序列突变分析模型,为检测基因突变提供模型基础。) u+ O% J1 R- f  c
    随着人类基因组计划的顺利完成,基因识别已成为生物信息学中最基础、最首要的问题。本文就基因识别方法的相关问题进行了深入探讨,提出了一些新的思路,期待有益于基因识别领域的后续研究。 ; @) Y7 _- x" I
    关键词:基因识别,功率谱,信噪比,AR模型,阈值,重采样
    ' S; M0 u' A6 P4 f0 B
    4 ]0 \# Q$ b* c; k4 q/ v: I A90005004杨丁刘.pdf (1.16 MB, 下载次数: 182)
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    数学建模社会化

    26

    主题

    64

    听众

    2090

    积分

  • TA的每日心情
    开心
    2018-4-20 22:04
  • 签到天数: 724 天

    [LV.9]以坛为家II

    国际赛参赛者

    国际赛参赛者

    国际赛参赛者

    网络挑战赛参赛者

    自我介绍
    研究生在读,数学建模爱好者

    社区QQ达人 新人进步奖

    群组Matlab讨论组

    群组2013年数学建模国赛备

    回复

    使用道具 举报

    hwj1991        

    2

    主题

    6

    听众

    41

    积分

    升级  37.89%

  • TA的每日心情
    郁闷
    2014-10-23 21:50
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    自我介绍
    研究生
    回复

    使用道具 举报

    joycezhou        

    33

    主题

    12

    听众

    272

    积分

    升级  86%

  • TA的每日心情
    擦汗
    2017-12-28 18:13
  • 签到天数: 63 天

    [LV.6]常住居民II

    自我介绍
    数模热爱者

    群组Matlab讨论组

    回复

    使用道具 举报

    yahsu        

    4

    主题

    3

    听众

    224

    积分

    升级  62%

  • TA的每日心情
    难过
    2014-9-28 14:46
  • 签到天数: 66 天

    [LV.6]常住居民II

    自我介绍
    我型我秀

    群组数学建模

    群组LINGO

    群组科学狂想曲

    群组西安交大数学建模

    群组C 语言讨论组

    回复

    使用道具 举报

    yahsu        

    4

    主题

    3

    听众

    224

    积分

    升级  62%

  • TA的每日心情
    难过
    2014-9-28 14:46
  • 签到天数: 66 天

    [LV.6]常住居民II

    自我介绍
    我型我秀

    群组数学建模

    群组LINGO

    群组科学狂想曲

    群组西安交大数学建模

    群组C 语言讨论组

    回复

    使用道具 举报

    fz5722        

    0

    主题

    9

    听众

    32

    积分

    升级  28.42%

  • TA的每日心情
    奋斗
    2014-9-23 06:05
  • 签到天数: 7 天

    [LV.3]偶尔看看II

    自我介绍
    fz
    回复

    使用道具 举报

    建模娃 实名认证       

    0

    主题

    11

    听众

    133

    积分

    升级  16.5%

  • TA的每日心情
    开心
    2014-9-9 14:57
  • 签到天数: 25 天

    [LV.4]偶尔看看III

    群组国赛讨论

    群组第六届国赛赛前冲刺培

    回复

    使用道具 举报

    0

    主题

    9

    听众

    23

    积分

    升级  18.95%

  • TA的每日心情
    奋斗
    2015-9-8 09:01
  • 签到天数: 4 天

    [LV.2]偶尔看看I

    自我介绍
    想参加数模比赛的研究生一枚

    社区QQ达人

    回复

    使用道具 举报

    0

    主题

    9

    听众

    6

    积分

    升级  1.05%

    该用户从未签到

    自我介绍
    研究生

    社区QQ达人

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-9 00:16 , Processed in 0.457038 second(s), 111 queries .

    回顶部