数学建模社区-数学中国

标题: 基于联合识别的基因预测 [打印本页]

作者: madio    时间: 2013-7-30 05:06
标题: 基于联合识别的基因预测
题 目 基于联合识别的基因预测
! G# k: ]6 T. L% i: k* O摘 要:
( u+ u" h( K. p  x' J- _6 T本文围绕基因序列识别问题,在合理假设的基础上,通过数学推导证明voss! W) c' u: U! _" y* k
映射和Z-curve 映射效果等价,并给出了实数映射的快速算法。而后通过统计分析,) n' b7 P: ?; w! G" C: S2 F3 M
模型优化对不同类物种进行了信噪比阈值确定并验证其有效性。最后根据联合识别
$ A9 G, D) p. E对未注释DNA 编码区预测进行了建模,实现和分析。# V8 X* _5 m2 Q: b3 F
针对问题1:推导出了Voss 映射下功率谱与信噪比的快速算法。其中,功率谱
+ y$ T3 M% S6 r/ E7 J算法仅需统计,无需进行繁杂的DFT 变换;信噪比算法把加窗处理和平均处理结- C' b# C+ Y4 K; f) _& ]5 j
合起来,大大加快计算速度。同时推导得出:Z-curve 映射下的频谱和信噪比分别
# ^  _# B! M+ f0 J4 E2 T) a为Voss 映射下的频谱和信噪比的4 倍和4/3 倍,并得出实数映射下信噪比的快速计
  `( H3 R. f/ R8 D9 ~, ~: Q3 p; J算公式。
  b% {6 Q# t2 D' y针对问题2:采用3 种阈值确定方法:经验阈值法、最优化方法、曲线法分别
) k' W) \# r2 f) P对人、小家鼠、褐家鼠、哺乳动物4 类基因进行阈值确定;依据敏感性、专一性、7 h7 ~1 A3 ^1 x% E5 M; o
总正确率3 指标分析不同阈值确定方法的基因判别效果,确定了基因的最优的阈值
$ r; j5 m* B! h" Y; [* d3 ?; R确定方法,并得到其最优信噪比阈值;最后针对误判原因进行了初步探讨。
% p6 c( l+ C# e+ Y$ M( i( p针对问题3:单一的固定窗口的功率谱图或是移动序列的信噪比曲线图在识别
0 z! M( F1 r+ A9 R, E上不够精确,通过两种曲线的联合识别,能更精确的判断外显子片段(区间和两端
8 B( z" r) e0 ?3 s4 t: t; K# I  y: p点)。且通过Matlab 里的Sequence Viewer 对所识别片段进行进一步辨识,提高了端
! Y4 U" v' R$ ~5 [1 d- r5 d4 ^点辨识准确度。
8 [* {3 W3 m0 t" k, Y针对问题4:总结出以下几种能够识别基因编码序列的特征指标,分别为“非$ Z( O" v2 \$ v+ W9 @/ q4 ~8 D6 Z
3-碱基周期性”编码序列指标,旋转矢量指标,非均匀指标及干涉指标。并对采用上( z/ u, H' T5 j& I8 W* t7 \5 k
述指标识别编码序列的原理进行了概括与总结。6 s; p8 V9 i6 x
本文亮点在于:(1)找到2 种最优阈值确定方法,通过统计其判别正确率,判
" Q0 D" p" F' I' ?% l/ f5 U别效果均好于以2 为阈值的经验法;(2)结合固定窗口滑动法与移动序列的信噪比. X) w6 ?, \) ~
- 2 -
% d4 j! a, |( m, x' \9 ^曲线法对基因识别的特点,提出联合识别理论,提高了辨识效果。
1 |8 |4 A  D: A6 C[关键词]:基因识别 功率谱 信噪比 阈值 3-周期特性 联合识别1 w6 |$ q/ U4 C4 X
) B9 e+ p( m* S2 k2 ~4 l
A10422053楚何程.pdf (1.38 MB, 下载次数: 109)
作者: 250548810@qq.co    时间: 2013-8-16 17:51
学习一下~~~~~~~
作者: yahsu    时间: 2014-6-8 18:49
谢谢分享   好东西
作者: yahsu    时间: 2014-6-9 17:17
好东西  谢谢分享
作者: 夏朗的芒果    时间: 2014-8-31 09:08
谢谢楼主分享。。。学习ing
作者: sx2460927670    时间: 2015-8-28 15:46
好贴。。。。。。。。。7 \# C4 O8 H  Q2 N+ G





欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5