TA的每日心情 | 奋斗 2024-7-1 22:21 |
|---|
签到天数: 2014 天 [LV.Master]伴坛终老
- 自我介绍
- 数学中国站长
 群组: 数学建模培训课堂1 群组: 数学中国美赛辅助报名 群组: Matlab讨论组 群组: 2013认证赛A题讨论群组 群组: 2013认证赛C题讨论群组 |
题 目 基于联合识别的基因预测8 q; s0 K* L) h* e; W
摘 要:' y+ h: G3 L$ E( u
本文围绕基因序列识别问题,在合理假设的基础上,通过数学推导证明voss! Q8 D( Y2 o( C7 s+ y. u+ d& R
映射和Z-curve 映射效果等价,并给出了实数映射的快速算法。而后通过统计分析,4 S: V( b) M' R Z8 l; k
模型优化对不同类物种进行了信噪比阈值确定并验证其有效性。最后根据联合识别
r% r5 U) r. ]6 [& J对未注释DNA 编码区预测进行了建模,实现和分析。, x6 G5 Q* ^$ A
针对问题1:推导出了Voss 映射下功率谱与信噪比的快速算法。其中,功率谱& q0 p$ {% n5 _! N' Q; w" T
算法仅需统计,无需进行繁杂的DFT 变换;信噪比算法把加窗处理和平均处理结
8 [# G: e# Z- _3 p合起来,大大加快计算速度。同时推导得出:Z-curve 映射下的频谱和信噪比分别. E% y. u+ D7 w8 z# v% s5 N2 \
为Voss 映射下的频谱和信噪比的4 倍和4/3 倍,并得出实数映射下信噪比的快速计
, B6 S: e+ P: K$ b$ W( E M& V算公式。1 V6 m4 C# p; r4 ?- G" {
针对问题2:采用3 种阈值确定方法:经验阈值法、最优化方法、曲线法分别% L6 c# q- k# h4 D T6 r3 H
对人、小家鼠、褐家鼠、哺乳动物4 类基因进行阈值确定;依据敏感性、专一性、
3 N! u m6 Q& D( G& v/ S总正确率3 指标分析不同阈值确定方法的基因判别效果,确定了基因的最优的阈值4 `0 V( j) o0 @" p: S3 J, h( d9 ~' t
确定方法,并得到其最优信噪比阈值;最后针对误判原因进行了初步探讨。
( T3 y8 U, Q* O针对问题3:单一的固定窗口的功率谱图或是移动序列的信噪比曲线图在识别. O. W% E0 q* b5 t: R! l4 K
上不够精确,通过两种曲线的联合识别,能更精确的判断外显子片段(区间和两端
6 x; x' }1 n. n. X点)。且通过Matlab 里的Sequence Viewer 对所识别片段进行进一步辨识,提高了端2 U9 Q8 L, n6 v. }: I! z( A/ M
点辨识准确度。; M7 ?3 H% ?4 {, @4 [7 H- V; X
针对问题4:总结出以下几种能够识别基因编码序列的特征指标,分别为“非
1 q+ x3 D$ `2 w4 V& t6 Z3 X1 h& i3-碱基周期性”编码序列指标,旋转矢量指标,非均匀指标及干涉指标。并对采用上
! @0 Q8 V, G' S1 b. ^6 Y述指标识别编码序列的原理进行了概括与总结。
8 B0 v: o5 D: ]1 ]" c+ h0 i$ i: \本文亮点在于:(1)找到2 种最优阈值确定方法,通过统计其判别正确率,判
9 n2 N& O- f6 R3 Q4 [6 t( L别效果均好于以2 为阈值的经验法;(2)结合固定窗口滑动法与移动序列的信噪比
$ k" Z% }% Y1 f- 2 -" v, h* ? _. Q+ G
曲线法对基因识别的特点,提出联合识别理论,提高了辨识效果。7 X# O1 N! m* e- S: h
[关键词]:基因识别 功率谱 信噪比 阈值 3-周期特性 联合识别% S- p K2 T1 @% E W
x1 L/ _ Z& h
A10422053楚何程.pdf
(1.38 MB, 下载次数: 109)
|
zan
|