TA的每日心情 | 奋斗 2024-7-1 22:21 |
---|
签到天数: 2014 天 [LV.Master]伴坛终老
- 自我介绍
- 数学中国站长
 群组: 数学建模培训课堂1 群组: 数学中国美赛辅助报名 群组: Matlab讨论组 群组: 2013认证赛A题讨论群组 群组: 2013认证赛C题讨论群组 |
题 目 基于联合识别的基因预测7 D) m3 t0 n4 K9 `5 L
摘 要:
4 e; x0 T3 b, m3 S* k本文围绕基因序列识别问题,在合理假设的基础上,通过数学推导证明voss+ j5 C) ^4 d6 B" h/ }
映射和Z-curve 映射效果等价,并给出了实数映射的快速算法。而后通过统计分析,# J. E1 x% i0 v. e- Q
模型优化对不同类物种进行了信噪比阈值确定并验证其有效性。最后根据联合识别+ a9 L1 w8 F( B" d6 p/ y% W/ _
对未注释DNA 编码区预测进行了建模,实现和分析。5 T/ v9 m N" v$ f0 d: i0 Y( h
针对问题1:推导出了Voss 映射下功率谱与信噪比的快速算法。其中,功率谱
: `: l- t9 |0 h+ ~, L' G4 x1 I算法仅需统计,无需进行繁杂的DFT 变换;信噪比算法把加窗处理和平均处理结3 v8 j/ g) E6 O
合起来,大大加快计算速度。同时推导得出:Z-curve 映射下的频谱和信噪比分别' O% q2 ^7 W, Y" A
为Voss 映射下的频谱和信噪比的4 倍和4/3 倍,并得出实数映射下信噪比的快速计
1 c- F! [2 L! f' n算公式。1 y) Z U6 W( M3 T
针对问题2:采用3 种阈值确定方法:经验阈值法、最优化方法、曲线法分别- u0 e+ C* h& V0 `+ L3 O" Y2 w
对人、小家鼠、褐家鼠、哺乳动物4 类基因进行阈值确定;依据敏感性、专一性、
7 S* F ^$ \- f. F' q1 i* x2 R总正确率3 指标分析不同阈值确定方法的基因判别效果,确定了基因的最优的阈值) {/ m& J, y1 a0 B: k7 Y* h3 n! ]! C
确定方法,并得到其最优信噪比阈值;最后针对误判原因进行了初步探讨。
& e3 q& J3 m" G3 j/ _* ]1 \针对问题3:单一的固定窗口的功率谱图或是移动序列的信噪比曲线图在识别
2 F6 ^5 z4 p6 ]6 i上不够精确,通过两种曲线的联合识别,能更精确的判断外显子片段(区间和两端
/ G9 t3 P* t3 H! k点)。且通过Matlab 里的Sequence Viewer 对所识别片段进行进一步辨识,提高了端6 t$ c% @. M& P
点辨识准确度。, Z5 U3 E- Z6 b
针对问题4:总结出以下几种能够识别基因编码序列的特征指标,分别为“非- `3 B6 f9 t3 T7 y! H
3-碱基周期性”编码序列指标,旋转矢量指标,非均匀指标及干涉指标。并对采用上; l w+ i4 I4 `6 L. a
述指标识别编码序列的原理进行了概括与总结。
7 f1 \+ G3 v( |, c1 W2 }本文亮点在于:(1)找到2 种最优阈值确定方法,通过统计其判别正确率,判 h8 W5 W' C" E+ @
别效果均好于以2 为阈值的经验法;(2)结合固定窗口滑动法与移动序列的信噪比
/ D$ c) q/ Y& [, C/ k- Y- 2 -! R$ u; n" R2 O2 ]( B6 @+ e
曲线法对基因识别的特点,提出联合识别理论,提高了辨识效果。/ n" |! o& L$ I% A( A' n
[关键词]:基因识别 功率谱 信噪比 阈值 3-周期特性 联合识别1 Y) f9 f3 g3 U# ^" O
1 Q8 d# V( d: V+ O% `6 s
A10422053楚何程.pdf
(1.38 MB, 下载次数: 109)
|
zan
|