基于复杂网络社团结构与贝叶斯网络模型的蛋白质功能预测 【摘要】:蛋白质是细胞功能的最终执行者,是维持一切生命活动最重要的物质,任何生物的大部分生命活动都与蛋白质息息相关。蛋白质功能预测是蛋白质组学领域的重要研究方向。高通量生物实验提供了大量的与蛋白质功能和蛋白质相互作用相关的实验数据。然而,这些海量的生物实验数据却含有比较高的假阳性,并且利用传统的生物实验方法验证高通量实验的结果效率很低。因此,利用计算机科学领域中数据挖掘、图形聚类等方法处理生物数据,预测蛋白质功能已经成为了生物信息学研究的一大热点。由于蛋白质相互作用数据可以建立蛋白质相互作用网络,利用图聚类方法就可以去分析蛋白质相互作用网络。目前大部分的图聚类方法将网络划分成若干彼此孤立的社团结构,忽略了网络中社团结构之间可能存在相互重叠的部分。派系过滤方法寻找网络中的完全联通子图,考虑到了网络中社团结构之间相互重叠的情况,更加适合蛋白质相互作用网络的分析。本文将派系过滤方法应用于分析蛋白质互作用网络,实现对蛋白质功能的预测。首先,收集、整合了BioGrid、DIP蛋白质相互作用数据库以及MIPS中FunCat蛋白质功能注释数据库中的信息,构建了一个数据相对完整的蛋白质数据处理平台;其次,采用Palla等人提出的派系过滤方法分析蛋白质相互作用网络,寻找带有重叠结构的社团结构。最后,利用贝叶斯网络模型,预测每一个社团结构内未注释蛋白质的功能。本文的蛋白质数据处理平台基于Window7系统,在Java环境中运行。通过对于
拟南芥中蛋白质功能的预测实验结果表明,本文采用的方法能够有效的对蛋白质功能进行预测,达到了预期的目的。【关键词】:蛋白质功能预测社团结构贝叶斯网络派系过滤法 【学位授予单位】:山西大学 【学位级别】:硕士 【学位授予年份】:2013 【分类号】:Q51;TP311.13
【目录】:中文摘要8-9ABSTRACT9-11第一章绪论11-191.1研究背景11-161.1.1后基因时代的生物信息学11-121.1.2国内外生物信息学的研究现状12-141.1.3蛋白质功能预测的研究目的粤意义14-151.1.4蛋白质功能预测方法综述15-161.2主要工作16-181.3论文结构18-19第二章蛋白质功能预测的理论与方法19-232.1基于蛋白质相互作用的蛋白质功能预测19-202.1.1直接注释方法19-202.1.2基干模块的方法202.2常用的蛋白质数据库20-232.2.1常用的蛋白质序列数据库20-212.2.2常用的蛋白质相互作用数据库21-222.2.3蛋白质功能注释数据库22-23第三章基于社团结构和贝叶斯网络的蛋白质功能预测23-333.1复杂网络的社团结构23-253.2复杂网络中社团结构发现的经典算法25-273.2.1Kernighan-Lin算法253.2.2谱平分法25-263.2.3GN快速算法26-273.2.4Newman快速算法273.3派系过滤算法27-283.4
贝叶斯网络28-293.5基于复杂网络社团结构和贝叶斯网络的蛋白质功能预测29-33第四章实验导数据分析33-454.1数据处理33-394.1.1MIPSFunCat蛋白质功能注释数据库33-344.1.2蛋白质数据库信息的整理34-374.1.3建立蛋白质数据平台37-394.2拟南芥的蛋白质功能预测39-454.2.1拟南芥蛋白质相互作用网络的社团结构39-414.2.2拟南芥蛋白质功能预测41-45第五章总结与展望45-475.1总结455.2展望45-47参考文献47-50攻读学位期间取得的研究成果50-51致谢51-52个人简况及联系方式52-55 本论文购买请联系页眉网站。