TA的每日心情 | 奋斗 2024-7-1 22:21 |
|---|
签到天数: 2014 天 [LV.Master]伴坛终老
- 自我介绍
- 数学中国站长
 群组: 数学建模培训课堂1 群组: 数学中国美赛辅助报名 群组: Matlab讨论组 群组: 2013认证赛A题讨论群组 群组: 2013认证赛C题讨论群组 |
题 目 基于联合识别的基因预测 [; w7 \1 u1 Y+ ~% C0 X
摘 要:
( ?1 L) v( ^/ A, |& I本文围绕基因序列识别问题,在合理假设的基础上,通过数学推导证明voss5 g5 @2 u- i' @& J9 B, f" ^1 i! [) o
映射和Z-curve 映射效果等价,并给出了实数映射的快速算法。而后通过统计分析," G6 X4 _9 L6 ~* Q C: p
模型优化对不同类物种进行了信噪比阈值确定并验证其有效性。最后根据联合识别
: j9 ?& k. C, b对未注释DNA 编码区预测进行了建模,实现和分析。' r( E" K0 h! p7 y
针对问题1:推导出了Voss 映射下功率谱与信噪比的快速算法。其中,功率谱; |( }) m O& D0 W' t e s5 e
算法仅需统计,无需进行繁杂的DFT 变换;信噪比算法把加窗处理和平均处理结4 V1 Y% j0 f1 o2 {+ j" P+ v% m
合起来,大大加快计算速度。同时推导得出:Z-curve 映射下的频谱和信噪比分别
/ X1 k+ m+ V: b) Q( ^' r/ e( k4 Q为Voss 映射下的频谱和信噪比的4 倍和4/3 倍,并得出实数映射下信噪比的快速计
1 Q3 P7 a4 m3 l7 I! i算公式。# P) Q- ~8 }0 a6 G; Z# }
针对问题2:采用3 种阈值确定方法:经验阈值法、最优化方法、曲线法分别
4 m6 T: S0 D# v6 z6 p! Z对人、小家鼠、褐家鼠、哺乳动物4 类基因进行阈值确定;依据敏感性、专一性、
8 A/ E4 P* }- z( V8 t总正确率3 指标分析不同阈值确定方法的基因判别效果,确定了基因的最优的阈值3 m1 s# s. [5 k9 H. v- K3 Q
确定方法,并得到其最优信噪比阈值;最后针对误判原因进行了初步探讨。- T9 _. N8 L o( J2 I) l
针对问题3:单一的固定窗口的功率谱图或是移动序列的信噪比曲线图在识别3 _& V, W9 F9 W D2 j" d/ V
上不够精确,通过两种曲线的联合识别,能更精确的判断外显子片段(区间和两端+ V* B* z4 y& r2 J N
点)。且通过Matlab 里的Sequence Viewer 对所识别片段进行进一步辨识,提高了端4 ^$ E+ w# z; u- |" `9 Z
点辨识准确度。1 _5 ^! q) h( r' h1 R2 j
针对问题4:总结出以下几种能够识别基因编码序列的特征指标,分别为“非
3 l$ w; Y( h; [( e- j3-碱基周期性”编码序列指标,旋转矢量指标,非均匀指标及干涉指标。并对采用上! m; o l' i# C: Y- u8 e4 r2 [9 t
述指标识别编码序列的原理进行了概括与总结。
2 ]2 j% N* L# h& D3 a+ Q/ @1 q本文亮点在于:(1)找到2 种最优阈值确定方法,通过统计其判别正确率,判4 d2 ?+ K3 u0 T. C
别效果均好于以2 为阈值的经验法;(2)结合固定窗口滑动法与移动序列的信噪比- O Z7 W3 L" R
- 2 -
, c% i( W7 p- G; k曲线法对基因识别的特点,提出联合识别理论,提高了辨识效果。
) E! p: u+ o- W. z[关键词]:基因识别 功率谱 信噪比 阈值 3-周期特性 联合识别0 D1 [' B) G3 f3 r a1 o9 D
5 G( B) V3 Y) |* W6 Z0 E
A10422053楚何程.pdf
(1.38 MB, 下载次数: 109)
|
zan
|