TA的每日心情 | 奋斗 2024-7-1 22:21 |
|---|
签到天数: 2014 天 [LV.Master]伴坛终老
- 自我介绍
- 数学中国站长
 群组: 数学建模培训课堂1 群组: 数学中国美赛辅助报名 群组: Matlab讨论组 群组: 2013认证赛A题讨论群组 群组: 2013认证赛C题讨论群组 |
题 目 基于联合识别的基因预测" s6 [+ ]6 h0 W! f6 l
摘 要:3 R1 Z! E2 _) I3 [0 Z- n
本文围绕基因序列识别问题,在合理假设的基础上,通过数学推导证明voss/ {8 W8 h' M& Q; u" _' ^' B
映射和Z-curve 映射效果等价,并给出了实数映射的快速算法。而后通过统计分析,
9 l: c- n- f+ d3 _' j9 H$ I模型优化对不同类物种进行了信噪比阈值确定并验证其有效性。最后根据联合识别
4 q2 f4 Q3 g: w C) ?' Q对未注释DNA 编码区预测进行了建模,实现和分析。! D4 F0 o6 W" X' s, J& f, p; X) G
针对问题1:推导出了Voss 映射下功率谱与信噪比的快速算法。其中,功率谱 V( T6 k. d! g" k
算法仅需统计,无需进行繁杂的DFT 变换;信噪比算法把加窗处理和平均处理结1 ^" S: k$ ~ g) T
合起来,大大加快计算速度。同时推导得出:Z-curve 映射下的频谱和信噪比分别5 E. j! T* J) @8 J) u
为Voss 映射下的频谱和信噪比的4 倍和4/3 倍,并得出实数映射下信噪比的快速计
5 o8 v/ q6 u( F, l算公式。0 r+ I$ K7 h/ Y, X7 N5 w
针对问题2:采用3 种阈值确定方法:经验阈值法、最优化方法、曲线法分别
! ]3 l( b c& y+ l" @$ R* C# W对人、小家鼠、褐家鼠、哺乳动物4 类基因进行阈值确定;依据敏感性、专一性、6 V/ A" s4 X( ^( \ [ I- t. e9 t
总正确率3 指标分析不同阈值确定方法的基因判别效果,确定了基因的最优的阈值
# ~% p5 c6 b2 l& m, `, }( K* I确定方法,并得到其最优信噪比阈值;最后针对误判原因进行了初步探讨。+ ^3 ]- b0 _4 |
针对问题3:单一的固定窗口的功率谱图或是移动序列的信噪比曲线图在识别
; W; Z/ b: u7 o9 I上不够精确,通过两种曲线的联合识别,能更精确的判断外显子片段(区间和两端1 _5 c6 C8 y5 n% y) p3 o F
点)。且通过Matlab 里的Sequence Viewer 对所识别片段进行进一步辨识,提高了端7 E1 t ?+ \& Q* b+ O" }
点辨识准确度。
( G! l& p* g6 n& t$ Q针对问题4:总结出以下几种能够识别基因编码序列的特征指标,分别为“非
# b) _* T8 r' T" G Z1 b8 f- J3-碱基周期性”编码序列指标,旋转矢量指标,非均匀指标及干涉指标。并对采用上% P# w' }5 Y5 t- \5 D Q
述指标识别编码序列的原理进行了概括与总结。
- {0 h% U+ l% g. L本文亮点在于:(1)找到2 种最优阈值确定方法,通过统计其判别正确率,判+ T9 P. L" C' q' T N0 C
别效果均好于以2 为阈值的经验法;(2)结合固定窗口滑动法与移动序列的信噪比
, m* \+ [- N) m% b- 2 -
* h8 g( X: _" s) V# n i曲线法对基因识别的特点,提出联合识别理论,提高了辨识效果。. ]1 P0 U" N: q9 f
[关键词]:基因识别 功率谱 信噪比 阈值 3-周期特性 联合识别
6 J: X# a( ]' D" T6 `; V4 f. I5 `' g% S v. L; l) t: E$ g* Z
A10422053楚何程.pdf
(1.38 MB, 下载次数: 109)
|
zan
|