TA的每日心情 | 奋斗 2024-7-1 22:21 |
---|
签到天数: 2014 天 [LV.Master]伴坛终老
- 自我介绍
- 数学中国站长
 群组: 数学建模培训课堂1 群组: 数学中国美赛辅助报名 群组: Matlab讨论组 群组: 2013认证赛A题讨论群组 群组: 2013认证赛C题讨论群组 |
题 目 基于联合识别的基因预测
$ R. M3 s! I4 k. O; R, F( j* a摘 要:
: i- ~; C% P0 a本文围绕基因序列识别问题,在合理假设的基础上,通过数学推导证明voss5 Z& \3 B5 X5 w) d! x
映射和Z-curve 映射效果等价,并给出了实数映射的快速算法。而后通过统计分析,
: H0 r& e' D4 x0 W- E, U4 C: a模型优化对不同类物种进行了信噪比阈值确定并验证其有效性。最后根据联合识别
* o4 p. U& z8 Q+ l+ T对未注释DNA 编码区预测进行了建模,实现和分析。
2 L9 V! X2 W6 h) r' d针对问题1:推导出了Voss 映射下功率谱与信噪比的快速算法。其中,功率谱1 {' u2 l* x8 k" Y8 U+ E
算法仅需统计,无需进行繁杂的DFT 变换;信噪比算法把加窗处理和平均处理结
/ V" ^, M" R% O2 }合起来,大大加快计算速度。同时推导得出:Z-curve 映射下的频谱和信噪比分别5 q) f, f' ?4 a7 `5 Q7 q/ x
为Voss 映射下的频谱和信噪比的4 倍和4/3 倍,并得出实数映射下信噪比的快速计" j3 G3 I) e; F- o
算公式。
* ^$ B1 i5 }1 @! T. P' X' n2 v针对问题2:采用3 种阈值确定方法:经验阈值法、最优化方法、曲线法分别2 E4 c! z. o1 B1 G( a9 m9 ?( s6 F
对人、小家鼠、褐家鼠、哺乳动物4 类基因进行阈值确定;依据敏感性、专一性、
2 }6 [( i" [7 P' f/ ~总正确率3 指标分析不同阈值确定方法的基因判别效果,确定了基因的最优的阈值
7 H( Z4 w* M8 u9 g& l: [确定方法,并得到其最优信噪比阈值;最后针对误判原因进行了初步探讨。: C5 E* A( c0 o7 R% p r2 W
针对问题3:单一的固定窗口的功率谱图或是移动序列的信噪比曲线图在识别( o% ?0 e! D- W( c- n" ]& o
上不够精确,通过两种曲线的联合识别,能更精确的判断外显子片段(区间和两端" {" t( E1 O# o \5 I( J: o' S
点)。且通过Matlab 里的Sequence Viewer 对所识别片段进行进一步辨识,提高了端! ]6 K7 E* ~" i; h
点辨识准确度。
6 P8 b% L+ y e& b0 p针对问题4:总结出以下几种能够识别基因编码序列的特征指标,分别为“非
, a1 l( B$ X1 G0 [3-碱基周期性”编码序列指标,旋转矢量指标,非均匀指标及干涉指标。并对采用上
0 }1 N9 K" A% c# j述指标识别编码序列的原理进行了概括与总结。7 a( H, m1 W2 K& N; f9 \2 f* Q
本文亮点在于:(1)找到2 种最优阈值确定方法,通过统计其判别正确率,判
( a$ y1 `0 Z" Z( {. T) x% u) P; I别效果均好于以2 为阈值的经验法;(2)结合固定窗口滑动法与移动序列的信噪比' T' I: m8 q- M9 j' t; [
- 2 -
" b! P( D5 H: P* g2 @8 B4 U曲线法对基因识别的特点,提出联合识别理论,提高了辨识效果。
' Y1 i( P* M! G+ [[关键词]:基因识别 功率谱 信噪比 阈值 3-周期特性 联合识别1 w/ t8 P' }4 G, X6 a! R% e
$ H5 S7 i# k( l0 p9 O! z
A10422053楚何程.pdf
(1.38 MB, 下载次数: 109)
|
zan
|