TA的每日心情 | 奋斗 2024-7-1 22:21 |
---|
签到天数: 2014 天 [LV.Master]伴坛终老
- 自我介绍
- 数学中国站长
 群组: 数学建模培训课堂1 群组: 数学中国美赛辅助报名 群组: Matlab讨论组 群组: 2013认证赛A题讨论群组 群组: 2013认证赛C题讨论群组 |
题 目 基于联合识别的基因预测 [, l5 \ J3 v& v
摘 要:
2 X) q! c* E9 L* |本文围绕基因序列识别问题,在合理假设的基础上,通过数学推导证明voss
" F6 z; [5 W# h- t! G映射和Z-curve 映射效果等价,并给出了实数映射的快速算法。而后通过统计分析,6 K3 R' \, _4 u4 Z
模型优化对不同类物种进行了信噪比阈值确定并验证其有效性。最后根据联合识别
$ d4 g5 D. ~$ w4 D对未注释DNA 编码区预测进行了建模,实现和分析。
# F# p6 V3 T7 \4 k8 G2 r# G8 l针对问题1:推导出了Voss 映射下功率谱与信噪比的快速算法。其中,功率谱
& D5 f* Z; o$ {( V# i9 U4 F算法仅需统计,无需进行繁杂的DFT 变换;信噪比算法把加窗处理和平均处理结1 @7 q2 v1 f7 y: q& Y6 n
合起来,大大加快计算速度。同时推导得出:Z-curve 映射下的频谱和信噪比分别4 G1 `% W) o' @2 `
为Voss 映射下的频谱和信噪比的4 倍和4/3 倍,并得出实数映射下信噪比的快速计" M: C3 r7 \" F S8 t6 _+ {
算公式。. ^4 K: s& m: c5 P3 S6 r6 `
针对问题2:采用3 种阈值确定方法:经验阈值法、最优化方法、曲线法分别2 b% h+ w& g( j1 f
对人、小家鼠、褐家鼠、哺乳动物4 类基因进行阈值确定;依据敏感性、专一性、
7 { k5 O: _7 R9 D总正确率3 指标分析不同阈值确定方法的基因判别效果,确定了基因的最优的阈值* s/ C8 y" J. Z- @/ Z* [9 Q
确定方法,并得到其最优信噪比阈值;最后针对误判原因进行了初步探讨。
7 J5 G3 K- y2 o, P针对问题3:单一的固定窗口的功率谱图或是移动序列的信噪比曲线图在识别
# Y' J; B9 z0 O- K1 f7 T上不够精确,通过两种曲线的联合识别,能更精确的判断外显子片段(区间和两端. g3 d* Y! [& n Y C/ C1 U* }
点)。且通过Matlab 里的Sequence Viewer 对所识别片段进行进一步辨识,提高了端! i- @* Y; a9 H! ~ y) l/ w
点辨识准确度。
0 M3 \( @9 O2 O3 T6 l( j) b _/ N6 t针对问题4:总结出以下几种能够识别基因编码序列的特征指标,分别为“非
' \/ z2 @1 l1 g( Y4 `! }3-碱基周期性”编码序列指标,旋转矢量指标,非均匀指标及干涉指标。并对采用上
) ^1 Q% B" `* @, k: u: `9 ~述指标识别编码序列的原理进行了概括与总结。
" @6 I9 P+ Z, `本文亮点在于:(1)找到2 种最优阈值确定方法,通过统计其判别正确率,判
o- ?# \& O8 i: U$ d别效果均好于以2 为阈值的经验法;(2)结合固定窗口滑动法与移动序列的信噪比/ h. Y7 \1 Q- j' i( ?: s5 p/ S
- 2 -
( _. _5 x2 z" m u% M曲线法对基因识别的特点,提出联合识别理论,提高了辨识效果。( x3 w* {' j2 M, K2 Z
[关键词]:基因识别 功率谱 信噪比 阈值 3-周期特性 联合识别) r" x4 c5 p0 x0 w. A5 B
8 [/ G X6 t" R; K- `
A10422053楚何程.pdf
(1.38 MB, 下载次数: 109)
|
zan
|