madio 发表于 2012-9-15 07:36

确定肿瘤的重要基因信息

题 目         确定肿瘤的重要基因信息
摘       要:
随着生物分子学的发展,人们已经发现癌症与基因之间存在密切关系。
本文通过对比基因表达谱中不同样本的表达水平的差别,区分出无关基因和信息基因,在信息基因的空间中搜索分类能力强的特征子集,然后将所有样本划分为训练集和测试集,使用支持向量机SVM和人工神经网络检查特征子集的分类能力。其次,再考虑噪声的定义,以及如何去除噪音,并分析噪声对特征子集分类能力的影响。最后,生成特征子集的时候需要考虑已有的医学发现,提出基于知识库的基因图谱分析模型KFS模型,有效利用了医学成果。
第一问,利用巴氏距离模型和理想基因模型区分无关基因和相关基因,剔除基因表达谱中无关基因,达到降维的效果。
第二问,使用FSSM算法在信息基因空间里寻找出候选特征子集,然后将样本划分为训练集和测试集,使用支持向量机SVM和人工神经网络,对FSSM搜索出来的特征子集的分类能力进行判定。本文得到由5个信息基因组成的特征子集,样本分类正确率达到95.79%。
        第三问,考虑了阈值滤波和主成分分析两种去噪模型,并阐述噪音模型在高斯过程分类器的构建中的作用,最后论述噪音能够在学习算法中防止过渡拟合从而可以孵化出泛化能力更强的分类器用于确定基因标签。
        第四问,提出基于知识库的基因图谱分析模型KFS模型,该模型在引入信息基因知识库的基础上,对基因图谱进行去噪处理、样本评价函数增益、剔除无关基因,并采用基于知识库的KFSSM算法获得特征子集,最后分别采用SVM及ANN方法获取信息基因集合。本文最后对已知临床经验的结肠癌数据进行处理得到一组信息基因组合,样本分类正确率达到94.52%。
关键词:基因表达谱,信息基因,巴氏距离,FSSM,噪声,KFS模型
参赛队号10286037_                  
队员姓名 邹昊东 马俊 陈建锋  

jxgzhjy 发表于 2012-9-18 09:33

感谢分享{:3_50:}

lchy123 发表于 2012-12-5 22:27

谢谢楼主分享

lchy123 发表于 2012-12-5 22:27

先顶一下!

woshidazixiang 发表于 2013-5-8 09:30

太好了  正是我要找的

woshidazixiang 发表于 2013-5-8 09:34

太棒了  真的很好

cjy570312167 发表于 2013-7-22 09:22

不错额,向你们学习

jmdx2006 发表于 2013-8-27 15:11

谢谢分享,下载学习了
页: [1]
查看完整版本: 确定肿瘤的重要基因信息