数学建模社区-数学中国
标题:
基于联合识别的基因预测
[打印本页]
作者:
madio
时间:
2013-7-30 05:06
标题:
基于联合识别的基因预测
题 目 基于联合识别的基因预测
+ B8 l m0 l5 c* [1 C
摘 要:
A7 k5 v# W5 Q9 N
本文围绕基因序列识别问题,在合理假设的基础上,通过数学推导证明voss
4 J9 S# G3 u7 @$ H+ X
映射和Z-curve 映射效果等价,并给出了实数映射的快速算法。而后通过统计分析,
6 b/ n e4 \* g& e, u
模型优化对不同类物种进行了信噪比阈值确定并验证其有效性。最后根据联合识别
2 H' Y4 L$ m3 z; q4 D# K
对未注释DNA 编码区预测进行了建模,实现和分析。
) b+ l$ t$ S4 h
针对问题1:推导出了Voss 映射下功率谱与信噪比的快速算法。其中,功率谱
- _! i9 G2 r }% w
算法仅需统计,无需进行繁杂的DFT 变换;信噪比算法把加窗处理和平均处理结
6 G' G* ]# z6 e; A; w4 [ ~
合起来,大大加快计算速度。同时推导得出:Z-curve 映射下的频谱和信噪比分别
' J3 O! c3 \. `
为Voss 映射下的频谱和信噪比的4 倍和4/3 倍,并得出实数映射下信噪比的快速计
! ]; \1 T8 W c+ F' ]7 m5 ~
算公式。
4 e7 y4 u- b4 ?; Z
针对问题2:采用3 种阈值确定方法:经验阈值法、最优化方法、曲线法分别
$ F. [2 P' F; J( Q) v
对人、小家鼠、褐家鼠、哺乳动物4 类基因进行阈值确定;依据敏感性、专一性、
5 h; h* E1 [# ?+ t
总正确率3 指标分析不同阈值确定方法的基因判别效果,确定了基因的最优的阈值
- H: y0 [3 Y$ o _5 a
确定方法,并得到其最优信噪比阈值;最后针对误判原因进行了初步探讨。
) l' ^/ F9 }" Y& K. m3 H$ F
针对问题3:单一的固定窗口的功率谱图或是移动序列的信噪比曲线图在识别
; j0 Y8 ^& r- |" F) _8 x* a
上不够精确,通过两种曲线的联合识别,能更精确的判断外显子片段(区间和两端
/ z% G8 C/ p1 }* I4 p* ~. U! E! C
点)。且通过Matlab 里的Sequence Viewer 对所识别片段进行进一步辨识,提高了端
! u) ~ D7 h& j# H. M
点辨识准确度。
e5 f0 t9 H. i, G. u& |9 G: ]2 `
针对问题4:总结出以下几种能够识别基因编码序列的特征指标,分别为“非
, i0 w5 r% `" b2 F8 ~
3-碱基周期性”编码序列指标,旋转矢量指标,非均匀指标及干涉指标。并对采用上
6 H' N5 K v# J- A
述指标识别编码序列的原理进行了概括与总结。
2 z2 q2 a- Q& J e" G( s( N8 t
本文亮点在于:(1)找到2 种最优阈值确定方法,通过统计其判别正确率,判
) M& v- {% c; E+ w. c* K
别效果均好于以2 为阈值的经验法;(2)结合固定窗口滑动法与移动序列的信噪比
3 k* T, M5 c: y' P8 F! d. x8 c% _, D
- 2 -
7 ~3 n4 S+ N$ R4 _
曲线法对基因识别的特点,提出联合识别理论,提高了辨识效果。
% m. b4 ~4 j& C5 w) q5 O$ y
[关键词]:基因识别 功率谱 信噪比 阈值 3-周期特性 联合识别
8 N6 b0 Q) _- {& \$ B1 i
. w: Z; z7 k- T* \& r
A10422053楚何程.pdf
(1.38 MB, 下载次数: 109)
2013-7-30 05:06 上传
点击文件名下载附件
下载积分: 体力 -2 点
作者:
250548810@qq.co
时间:
2013-8-16 17:51
学习一下~~~~~~~
作者:
yahsu
时间:
2014-6-8 18:49
谢谢分享 好东西
作者:
yahsu
时间:
2014-6-9 17:17
好东西 谢谢分享
作者:
夏朗的芒果
时间:
2014-8-31 09:08
谢谢楼主分享。。。学习ing
作者:
sx2460927670
时间:
2015-8-28 15:46
好贴。。。。。。。。。
( j9 h, E% H7 U
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5