数学建模社区-数学中国

标题: 基于联合识别的基因预测 [打印本页]

作者: madio    时间: 2013-7-30 05:06
标题: 基于联合识别的基因预测
题 目 基于联合识别的基因预测
  r; U2 O1 m6 J( ~7 J# g摘 要:: r, @- H* ?# \" s* Q
本文围绕基因序列识别问题,在合理假设的基础上,通过数学推导证明voss% j6 W5 }3 w  h# C6 H6 E7 `
映射和Z-curve 映射效果等价,并给出了实数映射的快速算法。而后通过统计分析,
% b4 k! e* b) i* X8 d& m: ^9 r模型优化对不同类物种进行了信噪比阈值确定并验证其有效性。最后根据联合识别6 C& H2 |2 x) Z/ S' s+ r1 r2 x
对未注释DNA 编码区预测进行了建模,实现和分析。, h/ _4 R5 J, p: s8 L7 F/ G$ Y
针对问题1:推导出了Voss 映射下功率谱与信噪比的快速算法。其中,功率谱8 B! D0 f$ p9 |3 N& \3 Y" o; |
算法仅需统计,无需进行繁杂的DFT 变换;信噪比算法把加窗处理和平均处理结
! m- [$ [/ k1 ]! S) A合起来,大大加快计算速度。同时推导得出:Z-curve 映射下的频谱和信噪比分别
4 ^" J6 x: C+ t9 c( x1 |$ s6 D为Voss 映射下的频谱和信噪比的4 倍和4/3 倍,并得出实数映射下信噪比的快速计
" |" f* F* q1 o& B. P, ~) E算公式。$ M" i9 l' w2 N! U
针对问题2:采用3 种阈值确定方法:经验阈值法、最优化方法、曲线法分别
. G  X7 e# n* _0 a( x对人、小家鼠、褐家鼠、哺乳动物4 类基因进行阈值确定;依据敏感性、专一性、
( H: D9 ^6 {2 `7 w' e# i; _" C总正确率3 指标分析不同阈值确定方法的基因判别效果,确定了基因的最优的阈值# C0 Q  j4 a7 _7 N0 y
确定方法,并得到其最优信噪比阈值;最后针对误判原因进行了初步探讨。+ B$ F* {7 {% \( F7 Y% Y1 I3 f6 g
针对问题3:单一的固定窗口的功率谱图或是移动序列的信噪比曲线图在识别+ l6 i/ \/ {$ T% t$ N# v
上不够精确,通过两种曲线的联合识别,能更精确的判断外显子片段(区间和两端
1 R0 J. e3 `0 @+ X  w% e2 R点)。且通过Matlab 里的Sequence Viewer 对所识别片段进行进一步辨识,提高了端
3 }; c2 M7 o* I; i( Q点辨识准确度。" }# ?* c' u' N  M; |- _
针对问题4:总结出以下几种能够识别基因编码序列的特征指标,分别为“非1 P' [2 R$ K+ X4 H$ a
3-碱基周期性”编码序列指标,旋转矢量指标,非均匀指标及干涉指标。并对采用上3 l8 Y3 ^+ }7 g( P' I) M, w/ K% i
述指标识别编码序列的原理进行了概括与总结。6 \) R( }1 s3 a% G0 g) V) G0 e
本文亮点在于:(1)找到2 种最优阈值确定方法,通过统计其判别正确率,判% z1 Z% q- h5 v4 ]3 j
别效果均好于以2 为阈值的经验法;(2)结合固定窗口滑动法与移动序列的信噪比
0 K. V# m  l* n( J2 o( U# t  Y- m- 2 -+ _8 @+ _& S8 h  H- K5 n5 m
曲线法对基因识别的特点,提出联合识别理论,提高了辨识效果。
5 v' b. y" I; s. E[关键词]:基因识别 功率谱 信噪比 阈值 3-周期特性 联合识别
6 a0 U9 E# n5 ]/ ~+ y. M* a% ]: S; o9 h% A8 B1 u
A10422053楚何程.pdf (1.38 MB, 下载次数: 109)
作者: 250548810@qq.co    时间: 2013-8-16 17:51
学习一下~~~~~~~
作者: yahsu    时间: 2014-6-8 18:49
谢谢分享   好东西
作者: yahsu    时间: 2014-6-9 17:17
好东西  谢谢分享
作者: 夏朗的芒果    时间: 2014-8-31 09:08
谢谢楼主分享。。。学习ing
作者: sx2460927670    时间: 2015-8-28 15:46
好贴。。。。。。。。。! `' ]$ i4 [1 \7 `& V





欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5