TA的每日心情 | 奋斗 2024-7-1 22:21 |
|---|
签到天数: 2014 天 [LV.Master]伴坛终老
- 自我介绍
- 数学中国站长
 群组: 数学建模培训课堂1 群组: 数学中国美赛辅助报名 群组: Matlab讨论组 群组: 2013认证赛A题讨论群组 群组: 2013认证赛C题讨论群组 |
题 目 基于联合识别的基因预测3 Q0 f4 R+ d2 P* y& L' {5 R
摘 要:
; E4 J+ z+ B3 p) `/ U本文围绕基因序列识别问题,在合理假设的基础上,通过数学推导证明voss
% `4 e3 [; m; s6 n2 y4 c映射和Z-curve 映射效果等价,并给出了实数映射的快速算法。而后通过统计分析,
4 E' R! e8 \$ u5 C0 k/ w模型优化对不同类物种进行了信噪比阈值确定并验证其有效性。最后根据联合识别; A/ b1 |0 x+ d# n
对未注释DNA 编码区预测进行了建模,实现和分析。& l# s2 N: [9 x+ b& k* w3 e+ a7 C
针对问题1:推导出了Voss 映射下功率谱与信噪比的快速算法。其中,功率谱
7 |( \( R& s% g% W( K& _- U Q算法仅需统计,无需进行繁杂的DFT 变换;信噪比算法把加窗处理和平均处理结/ i3 M8 y" l7 [+ H. e
合起来,大大加快计算速度。同时推导得出:Z-curve 映射下的频谱和信噪比分别) X9 V. B( n2 E6 X" o
为Voss 映射下的频谱和信噪比的4 倍和4/3 倍,并得出实数映射下信噪比的快速计5 ~2 Y0 V5 ?7 k, Z0 \3 w$ Q! q
算公式。8 Y/ L1 F6 x* V1 E
针对问题2:采用3 种阈值确定方法:经验阈值法、最优化方法、曲线法分别
' G9 g) g. Z) t' w$ m+ F m对人、小家鼠、褐家鼠、哺乳动物4 类基因进行阈值确定;依据敏感性、专一性、2 ^; t. g# g! h; t( c1 z
总正确率3 指标分析不同阈值确定方法的基因判别效果,确定了基因的最优的阈值
! u0 B$ `. P3 V. P$ Y& w确定方法,并得到其最优信噪比阈值;最后针对误判原因进行了初步探讨。, ^( P' g0 ?( y9 C. p( P
针对问题3:单一的固定窗口的功率谱图或是移动序列的信噪比曲线图在识别
' N) i: t) C4 I0 p* ]" y8 M上不够精确,通过两种曲线的联合识别,能更精确的判断外显子片段(区间和两端# S+ N7 W1 Q: T0 p- F
点)。且通过Matlab 里的Sequence Viewer 对所识别片段进行进一步辨识,提高了端
- J+ r6 b, r# N& }, }+ E点辨识准确度。: x, Z0 K- V5 d I5 `
针对问题4:总结出以下几种能够识别基因编码序列的特征指标,分别为“非
% s6 s- Z/ |' A6 X4 j3-碱基周期性”编码序列指标,旋转矢量指标,非均匀指标及干涉指标。并对采用上
) G! \0 a$ E) F; G! I( N述指标识别编码序列的原理进行了概括与总结。
/ o8 s# \& L' e1 r9 C- z本文亮点在于:(1)找到2 种最优阈值确定方法,通过统计其判别正确率,判
# E) z- u, }/ t+ O" ^6 X别效果均好于以2 为阈值的经验法;(2)结合固定窗口滑动法与移动序列的信噪比
, A7 g: I8 O2 p- ^1 A2 d4 I/ J- 2 -0 \# O# I5 |" o0 n
曲线法对基因识别的特点,提出联合识别理论,提高了辨识效果。
4 d% b% Z7 A0 @* a; g[关键词]:基因识别 功率谱 信噪比 阈值 3-周期特性 联合识别9 T& y. Y1 H8 [% T6 V! {2 h
( k; ~. o4 n4 o \
A10422053楚何程.pdf
(1.38 MB, 下载次数: 109)
|
zan
|