数学建模社区-数学中国
标题:
基于联合识别的基因预测
[打印本页]
作者:
madio
时间:
2013-7-30 05:06
标题:
基于联合识别的基因预测
题 目 基于联合识别的基因预测
! G# k: ]6 T. L% i: k* O
摘 要:
( u+ u" h( K. p x' J- _6 T
本文围绕基因序列识别问题,在合理假设的基础上,通过数学推导证明voss
! W) c' u: U! _" y* k
映射和Z-curve 映射效果等价,并给出了实数映射的快速算法。而后通过统计分析,
) n' b7 P: ?; w! G" C: S2 F3 M
模型优化对不同类物种进行了信噪比阈值确定并验证其有效性。最后根据联合识别
$ A9 G, D) p. E
对未注释DNA 编码区预测进行了建模,实现和分析。
# V8 X* _5 m2 Q: b3 F
针对问题1:推导出了Voss 映射下功率谱与信噪比的快速算法。其中,功率谱
+ y$ T3 M% S6 r/ E7 J
算法仅需统计,无需进行繁杂的DFT 变换;信噪比算法把加窗处理和平均处理结
- C' b# C+ Y4 K; f) _& ]5 j
合起来,大大加快计算速度。同时推导得出:Z-curve 映射下的频谱和信噪比分别
# ^ _# B! M+ f0 J4 E2 T) a
为Voss 映射下的频谱和信噪比的4 倍和4/3 倍,并得出实数映射下信噪比的快速计
`( H3 R. f/ R8 D9 ~, ~: Q3 p; J
算公式。
b% {6 Q# t2 D' y
针对问题2:采用3 种阈值确定方法:经验阈值法、最优化方法、曲线法分别
) k' W) \# r2 f) P
对人、小家鼠、褐家鼠、哺乳动物4 类基因进行阈值确定;依据敏感性、专一性、
7 h7 ~1 A3 ^1 x% E5 M; o
总正确率3 指标分析不同阈值确定方法的基因判别效果,确定了基因的最优的阈值
$ r; j5 m* B! h" Y; [* d3 ?; R
确定方法,并得到其最优信噪比阈值;最后针对误判原因进行了初步探讨。
% p6 c( l+ C# e+ Y$ M( i( p
针对问题3:单一的固定窗口的功率谱图或是移动序列的信噪比曲线图在识别
0 z! M( F1 r+ A9 R, E
上不够精确,通过两种曲线的联合识别,能更精确的判断外显子片段(区间和两端
8 B( z" r) e0 ?3 s4 t: t; K# I y: p
点)。且通过Matlab 里的Sequence Viewer 对所识别片段进行进一步辨识,提高了端
! Y4 U" v' R$ ~5 [1 d- r5 d4 ^
点辨识准确度。
8 [* {3 W3 m0 t" k, Y
针对问题4:总结出以下几种能够识别基因编码序列的特征指标,分别为“非
$ Z( O" v2 \$ v+ W9 @/ q4 ~8 D6 Z
3-碱基周期性”编码序列指标,旋转矢量指标,非均匀指标及干涉指标。并对采用上
( z/ u, H' T5 j& I8 W* t7 \5 k
述指标识别编码序列的原理进行了概括与总结。
6 s; p8 V9 i6 x
本文亮点在于:(1)找到2 种最优阈值确定方法,通过统计其判别正确率,判
" Q0 D" p" F' I' ?% l/ f5 U
别效果均好于以2 为阈值的经验法;(2)结合固定窗口滑动法与移动序列的信噪比
. X) w6 ?, \) ~
- 2 -
% d4 j! a, |( m, x' \9 ^
曲线法对基因识别的特点,提出联合识别理论,提高了辨识效果。
1 |8 |4 A D: A6 C
[关键词]:基因识别 功率谱 信噪比 阈值 3-周期特性 联合识别
1 w6 |$ q/ U4 C4 X
) B9 e+ p( m* S2 k2 ~4 l
A10422053楚何程.pdf
(1.38 MB, 下载次数: 109)
2013-7-30 05:06 上传
点击文件名下载附件
下载积分: 体力 -2 点
作者:
250548810@qq.co
时间:
2013-8-16 17:51
学习一下~~~~~~~
作者:
yahsu
时间:
2014-6-8 18:49
谢谢分享 好东西
作者:
yahsu
时间:
2014-6-9 17:17
好东西 谢谢分享
作者:
夏朗的芒果
时间:
2014-8-31 09:08
谢谢楼主分享。。。学习ing
作者:
sx2460927670
时间:
2015-8-28 15:46
好贴。。。。。。。。。
7 \# C4 O8 H Q2 N+ G
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5