导读:本文包含了结构域配体相互作用预测论文开题报告文献综述及选题提纲参考文献,主要关键词:文献挖掘,PDZ结构域,蛋白质相互作用,机器学习算法
结构域配体相互作用预测论文文献综述
胡斯奇[1](2009)在《一、简单接头蛋白PDZK1配体的鉴定,配体间功能性相互联系预测以及验证 二、通过整合机器学习算法预测系统高效鉴定HPV 16 E6相互作用PDZ结构域蛋白》一文中研究指出蛋白质与蛋白质分子之间的相互作用是细胞生命活动的基础和特征,几乎所有的蛋白质都需要通过与其它蛋白质相互作用形成复合体进而发挥功能,蛋白与不同的配体蛋白结合,发挥不同的功能、参与不同的信号通路。接头蛋白在相互作用网络中占据关键位置,起“桥梁”作用,在生命调控机制中发挥重要功能。本论文主要系统全面鉴定了简单接头蛋白PDZK1在全蛋白质组学水平上的潜在配体,并且通过文献挖掘的方法对其配体间的功能上的联系进行了预测并且加以验证。PDZK1作为一种简单接头蛋白,目前仅发现四个PDZ结构域,没有其他功能性结构域的发现。在本论文中,主要运用酵母双杂交筛选随机多肽文库联合高通量验证筛选PDZ配体库在全蛋白质组水平上系统全面鉴定PDZK1所有的潜在配体蛋白。我们假设与同一个接头蛋白相互作用的配体之间存在非常大的功能上的相关性,在于它们是否可以满足其中任意一个条件。1)同一个蛋白的两个配体具有类似的功能模式。对于某一个蛋白名称和某一个生物学功能描述词语同时出现在文献中可以粗略的反映蛋白和功能之间的联系,一个蛋白名称与一系列生物学功能关键词中的某些同时出现在文献中,而另一个配体在恰恰和这些功能关键词同时出现在文献中,说明他们可能具有相同的功能模式,那就表明它们之间存在着功能上的相关性。2)两个蛋白的生物学功能具有很强的相关性。在检索时,可以通过两个描述生物学功能词语共同存在的文献数目和单独存在的文献数目之比来计算功能之间的相关系数。本研究运用MILANO(Microarray Literature-based Annotation)在线工具(http://milano.md.huji.ac.il)进行文献挖掘,并基于上述假设进行配体间具有功能性联系的预测并且对此预测体系进行准确度评价。基于文献挖掘预测体系准确度比较高的基础上,本研究将此预测体系运用到所研究蛋白PDZK1上,在酵母叁杂交体系中确认了某个配体的存在可以对另一个配体与PDZK1的结合产生影响,并且在哺乳动物细胞中验证高表达的PDZK1配体D-AKAP2可以减弱PDZK1与BCR的相互作用。本研究策略可以适用于具有结合线性多肽结构域的接头蛋白的研究。本文的第二部分通过整合机器学习算法预测系统高效鉴定HPV 16 E6相互作用PDZ结构域蛋白。以往通过筛选等实验发现某个特定蛋白相互作用蛋白通常需要大量的时间和精力,而且通常会受到实验条件以及高丰度对低丰度抑制的影响。一种高效的方法是采用高通量算法对蛋白数据库中蛋白进行预筛来发现目标蛋白相互作用蛋白,而后通过实验证实。高危型人乳头瘤病毒Human papillomavirus HPV 16 E6蛋白的C末端具有PDZ结构域结合位点,具有和PDZ结构域蛋白结合的能力,而低危型人乳头瘤病毒与之相比,缺失与PDZ结构域相互作用能力。在本论文第二部分研究中,我们利用整合机器学习算法系统预测联合酵母双杂交实验鉴定HPV 16 E6相互作用蛋白质,证实了Veli3蛋白在酵母双杂交系统中与HPV 16 E6具有相互作用,提示在细胞环境中Veli 3很有可能是HPV 16 E6相互作用蛋白质。通过这种策略也可以研究其他具有PDZ结构域结合位点病毒蛋白。(本文来源于《中国协和医科大学》期刊2009-06-23)
张玲[2](2007)在《1.机器学习方法预测蛋白质结构域与配体的相互作用 2.利用色谱保留时间辅助多肽的质谱鉴定》一文中研究指出很大一部分的蛋白质相互作用是通过多肽结合型的结构域来介导的,这种结构域包括SH2,SH3,PDZ和MHC等等。然而用实验的方法筛选这些结构域结合的配体费时费力,而且,由于高丰度配体的抑制作用,实验方法很难筛选到低丰度的配体。一种理想的研究蛋白质相互作用的方法就是通过计算机高通量的筛选蛋白质序列数据库,然后再用实验的手段验证计算机预测出来的最可能的相互作用。目前的预测系统通常都在有限样本的交叉验证中表现良好,但这并不能保证他们在实际的数据库筛选中仍有好的表现。本文采用了叁种新型的蛋白质序列编码方式,使用机器学习的方法建立了一个整合的预测系统,筛选了Swi ssprot和Genbank蛋白数据库来预测10个SH3和3个PDZ结构域的配体。预测结果中的部分配体蛋白已经被其他研究者的实验证实为阳性,这说明该系统具有良好的预测能力,它的预测结果对后续的验证实验具有一定的指导意义。在应用二级质谱图鉴定多肽时,为了降低鉴定的假阳性率,通常会提高检索软件的阈值设定,这种行为导致了多肽鉴定的假阴性率的提高,大大降低了蛋白质组研究的效率。本文构建了经验的多肽保留时间数据库(Empirical Peptide RetentionTime,EPRT),在二级质谱鉴定中引入了保留时间作为新的参数。在新的实验中,谱图质量低于一定标准的的多肽鉴定,其保留时间还要和它们在EPRT数据库中的经验保留时间相比较,来进一步决定它们是否为阳性鉴定。在18个标准蛋白混合物和尿蛋白质组的实验中,应用保留时间辅助,使鉴定的阳性谱图数增长了15%-60%,阳性多肽数增长了8%-18%。不考虑谱图的质量,仅使用保留时间新鉴定出的谱图的假阳性率为3.7%;如果加上最低的Xcorr阈值来控制谱图质量,则假阳性率降低为0.18%。这种方法可以鉴定出一些不合标准的低丰度多肽的谱图。另外,EPRT数据库也增加了多肽鉴定的可信度,这对那些仅由一张二级质谱图鉴定出的多肽来讲尤其重要。随着更多的多肽的经验保留时间被收集到EPRT数据库中,质谱鉴定的效率会进一步提高。该方法可应用在任何标准的、可重复的分离系统中。(本文来源于《中国协和医科大学》期刊2007-06-01)
结构域配体相互作用预测论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
很大一部分的蛋白质相互作用是通过多肽结合型的结构域来介导的,这种结构域包括SH2,SH3,PDZ和MHC等等。然而用实验的方法筛选这些结构域结合的配体费时费力,而且,由于高丰度配体的抑制作用,实验方法很难筛选到低丰度的配体。一种理想的研究蛋白质相互作用的方法就是通过计算机高通量的筛选蛋白质序列数据库,然后再用实验的手段验证计算机预测出来的最可能的相互作用。目前的预测系统通常都在有限样本的交叉验证中表现良好,但这并不能保证他们在实际的数据库筛选中仍有好的表现。本文采用了叁种新型的蛋白质序列编码方式,使用机器学习的方法建立了一个整合的预测系统,筛选了Swi ssprot和Genbank蛋白数据库来预测10个SH3和3个PDZ结构域的配体。预测结果中的部分配体蛋白已经被其他研究者的实验证实为阳性,这说明该系统具有良好的预测能力,它的预测结果对后续的验证实验具有一定的指导意义。在应用二级质谱图鉴定多肽时,为了降低鉴定的假阳性率,通常会提高检索软件的阈值设定,这种行为导致了多肽鉴定的假阴性率的提高,大大降低了蛋白质组研究的效率。本文构建了经验的多肽保留时间数据库(Empirical Peptide RetentionTime,EPRT),在二级质谱鉴定中引入了保留时间作为新的参数。在新的实验中,谱图质量低于一定标准的的多肽鉴定,其保留时间还要和它们在EPRT数据库中的经验保留时间相比较,来进一步决定它们是否为阳性鉴定。在18个标准蛋白混合物和尿蛋白质组的实验中,应用保留时间辅助,使鉴定的阳性谱图数增长了15%-60%,阳性多肽数增长了8%-18%。不考虑谱图的质量,仅使用保留时间新鉴定出的谱图的假阳性率为3.7%;如果加上最低的Xcorr阈值来控制谱图质量,则假阳性率降低为0.18%。这种方法可以鉴定出一些不合标准的低丰度多肽的谱图。另外,EPRT数据库也增加了多肽鉴定的可信度,这对那些仅由一张二级质谱图鉴定出的多肽来讲尤其重要。随着更多的多肽的经验保留时间被收集到EPRT数据库中,质谱鉴定的效率会进一步提高。该方法可应用在任何标准的、可重复的分离系统中。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
结构域配体相互作用预测论文参考文献
[1].胡斯奇.一、简单接头蛋白PDZK1配体的鉴定,配体间功能性相互联系预测以及验证二、通过整合机器学习算法预测系统高效鉴定HPV16E6相互作用PDZ结构域蛋白[D].中国协和医科大学.2009
[2].张玲.1.机器学习方法预测蛋白质结构域与配体的相互作用2.利用色谱保留时间辅助多肽的质谱鉴定[D].中国协和医科大学.2007