亚细胞位置论文-翟云清,翟胜楠

亚细胞位置论文-翟云清,翟胜楠

导读:本文包含了亚细胞位置论文开题报告文献综述及选题提纲参考文献,主要关键词:亚细胞定位,同源蛋白,GO特征,LIFT_PCC算法

亚细胞位置论文文献综述

翟云清,翟胜楠[1](2018)在《基于多标记学习的人类蛋白质亚细胞多位置预测》一文中研究指出细胞被认为是组成生物体机能的最小单位,而蛋白质是组成细胞的生物大分子,在生物体的生命活动中起着至关重要的作用.给定一个蛋白质序列,预测它在哪一个具体的细胞器工作,如细胞膜、线粒体等,该方法称为蛋白质亚细胞定位.预测蛋白质亚细胞定位是了解其功能和确定药物靶点的必要步骤.现有的预测方法只能预测单个蛋白质的亚细胞位置,本文致力于预测多位点的蛋白质亚细胞位置预测,基于含有3 077个凋亡蛋白的数据集,提取其GO特征并使用LIFT_PCC算法进行预测,实验结果表明该方法整体精度达到了59.36%,并通过了性能测试,这表明该方法将成为一个非常有用的高通量工具.(本文来源于《湖北民族学院学报(自然科学版)》期刊2018年01期)

周航[2](2017)在《基于特征隐关联建模的蛋白质亚细胞位置预测研究》一文中研究指出了解蛋白质的亚细胞位置对于理解蛋白质的功能,蛋白质间的相互作用,药物的靶向治疗具有重要的意义。然而目前利用实验检验的方法来获取蛋白质的亚细胞位置需要耗费很大的成本和时间。因此利用蛋白质亚细胞位置预测工具来对大量的蛋白质进行预测具有重要意义。目前,领域内已经提出了一系列机器学习算法来构建模型,达到预测大规模蛋白质的亚细胞位置的目的。这些分类器关键步骤是将氨基酸序列编码成为特征向量。许多研究已经表明从生物学家所注释的生物域提取的特征,例如基因本体论特征和功能域特征,可以非常有效的提高预测准确性。然而,这些生物注释特征和功能域特征通常拥有很高的维度和大量的冗余,这可能会降低机器学习模型的性能。另外蛋白质可以同时存在于两个或更多个不同的亚细胞位置,而目前对于多亚细胞位置蛋白质的预测效果往往不是十分理想。在本篇论文中,我们提出一种新的基于氨基酸序列的人类蛋白质亚细胞定位预测方法,我们将它命名为Hum-mPLoc 3.0,在该方法中我们对12个人类亚细胞位置进行预测。我们将该蛋白质序列用不同方面的特征表示,即基因本体论(GO)注释特征,基于肽的功能结构域和基于残基的统计特征。为了系统地反映领域知识库的层次结构,我们提出一种称为HCM(隐相关性建模)的特征表示模型,其将通过对注释特征之间的隐藏的相关性建模来创建出更紧凑和更有区别性的特征向量。我们在四个数据集上与领域内其他的预测器进行了比较,实验结果表明,我们的方法能够最有效的预测人类蛋白质的亚细胞位置。同时,Hum-mPLoc 3.0对在Swiss-Prot数据库上的整个人类蛋白质组的进行了大规模应用揭示了细胞中的蛋白质共亚细胞定位偏好。(本文来源于《上海交通大学》期刊2017-02-01)

王晓,李辉,翟云清[3](2016)在《基于集成学习和基因本体标注库的细胞凋亡蛋白亚细胞位置预测》一文中研究指出针对目前凋亡蛋白的亚细胞定位预测精度不高的问题,提出了基于集成学习和基因本体(GO)标注库的细胞凋亡蛋白亚细胞位置预测方法.该方法采用凋亡蛋白及其同源蛋白的GO特征,结合两层集成策略,预测凋亡蛋白的亚细胞位置.在第一层,依据不同同源蛋白个数生成多个特征向量集合,选取距离权重K近邻分类器作为个体分类器,训练多个子预测模型,并以多数投票的方式集成.在第二层,将第一层的集成模型作为子预测模型,以多数投票的方式集成不同近邻个数预测模型.Jackknife检验结果表明:该方法在CL317凋亡蛋白数据集上预测准确率达到96.2%,优于其他方法;此外,还有效降低了数据不均衡带来的影响.(本文来源于《轻工学报》期刊2016年04期)

王彤,薛建新,谭文安[4](2015)在《利用半监督降维算法预测蛋白质亚细胞位置》一文中研究指出首先采用伪氨基酸组成(Pse AA)和特定位点记分矩阵(PSSM)2种方法组合的特征提取方法来表达蛋白质序列。通过该方法将蛋白质序列转化成特征向量,虽然该向量在很大程度上保留了蛋白质序列的原始信息,但是它产生的相应的维数会很高,这使得蛋白质亚细胞位置的预测过程变得很复杂。同时,就目前的情况来看,想要获取大量已标记的蛋白质亚细胞位置样本也很困难。为了解决这些问题,提出采用半监督降维算法(SS-MVP)对特征向量进行降维的同时能从标记和未标记的样本点中提取对分类有用的信息。基于降维后的样本利用支持向量机(SVM)的算法来预测蛋白质亚细胞位置类型。实验结果表明,采用上述方法既能简化蛋白质亚细胞位置的预测系统,又能提高其分类性能。(本文来源于《上海第二工业大学学报》期刊2015年03期)

姜燕[5](2015)在《基于多信息融合预测单定位和多定位凋亡蛋白质亚细胞位置》一文中研究指出蛋白质是生物体关键的组成成分,存在于细胞中不同区域的蛋白质它们的功能也不一样。所以,预测蛋白质在细胞中的位置能更好的了解它们的功能。我们建立了一个新的单定位凋亡蛋白质数据集,通过特征筛选提取了氨基酸n肽组分信息、蛋白质骨架信息、化学位移信息和蛋白质保守位点的进化信息,并根据蛋白质物理化学特性提取了亲疏水信息,最后将以上各单特征信息进行融合,采用支持向量机(SVM)算法及加权K近邻(K-Nearest Neighbors, KNN)算法对单定位细胞凋亡蛋白质数据集进行分类预测,Jackknife检验下总体预测成功率分别达到了81%和77.9%。以单定位凋亡蛋白质数据集为标准集,本文还构建了一个多定位凋亡蛋白质数据集作为独立测试集,以氨基酸二肽组分信息和蛋白质骨架信息作为多定位凋亡蛋白质数据集的特征参数。结合加权K近邻(K-Nearest Neighbors, KNN)算法对其进行预测,总体预测成功率达到60.9%。(本文来源于《内蒙古大学》期刊2015-05-01)

严寿江[6](2014)在《基于氨基酸约化和位置特异性得分矩阵的蛋白质亚细胞定位预测方法研究》一文中研究指出为了加速蛋白质结构和功能的注解进程,研究如何通过理论计算或统计方法来预测蛋白质在细胞中的定位就成了一个非常重要的研究课题。蛋白质亚细胞定位预测对蛋白质的功能、相互作用及调控机制的研究具有重要意义。其研究成果可对蛋白质相互作用研究及新药物的开发提供借鉴和参考,还可为蛋白质的信息分析和应用算法设计提供新的思路。目前蛋白质亚细胞定位预测的研究主要集中在以下几个方面:(1)构建或选择一个有效的基准数据集来训练和测试预测模型;(2)建立能够真正反映要预测序列的本质相关属性的数学表达;(3)开发强有力的算法;(4)寻找可以用于客观评估预测模型准确率的合理验证方法;(5)建立公用的预测网站。本文针对定位预测中信息的提取、挑选及融合等问题,运用机器学习方法对蛋白质亚细胞定位预测展开研究,主要工作如下:首先,我们提出了基于位置特异性得分矩阵(PSSM)的特征表示方法,在此基础上得到叁种新的特征,分别表征了进化距离、区域组成和家族分类信息,构建融合模型来系统的提取序列信息,并使用主成分分析(PCA)算法挑选关键信息。同时,还详细讨论了不同参数对实验结果的影响,具体的实验及比较结果显示了该方法的有效性。其次,通过氨基酸物化性质和结构性质的约化,描述序列局部和全局信息的“组成”、“转换”和“分布”特征,并基于氨基酸亲疏水性的数值统计特征,提出了一种新的蛋白质特征表示方法(NSBH)。分别使用叁种分类器KNN、SVM及BP神经网络进行预测,比较了几种方法和特征融合方法的预测结果,显示融合特征表示及结合SVM分类器时能够达到更好的预测准确率。最后,使用MATLAB实现相关算法的图形用户界面(GUI)设计。结合具体的实例说明GUI的设计、编译及打包软件过程,详细介绍了该软件的安装和使用教程,用户可以根据自己的需求选择对应的算法来验证或者应用。(本文来源于《浙江理工大学》期刊2014-12-25)

陈颖丽,李前忠[7](2009)在《不同亚细胞位置的细胞凋亡蛋白质的结构特性分析》一文中研究指出细胞凋亡蛋白质是一类与人类疾病密切相关的蛋白质,在肿瘤、神经退行性疾病等病理过程中都有细胞凋亡存在。由于这些蛋白质在生物体的生长发育和动态平衡中起重(本文来源于《生物物理学报》期刊2009年S1期)

陈颖丽,李前忠[8](2009)在《不同亚细胞位置的细胞凋亡蛋白质的结构特性分析》一文中研究指出细胞凋亡蛋白质是一类与人类疾病密切相关的蛋白质,在肿瘤、神经退行性疾病等病理过程中都有细胞凋亡存在。由于这些蛋白质在生物体的生长发育和动态平衡中起重(本文来源于《第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集》期刊2009-07-12)

陆文聪,钮冰,金雨欢[9](2008)在《基于AdaBoost算法的亚细胞位置预测》一文中研究指出由于亚细胞位置和蛋白质功能密切相关,又是基因产物(比如蛋白质)的一个关键的功能性特征,因此可以通过蛋白质亚细胞位置来推断蛋白质分子的功能。本文通过使用着名的集成学习算法(本文来源于《中国化学会第26届学术年会化学信息学与化学计量学分会场论文集》期刊2008-07-01)

陈颖丽,李前忠,樊国梁,杨科利[10](2008)在《基于支持向量机的多类凋亡蛋白亚细胞位置预测》一文中研究指出基于支持向量机,以全部和局部氨基酸序列的n肽组分、序列的亲疏水性分布等五种特征提取方法构成特征向量表示蛋白质序列,对六类细胞凋亡蛋白的亚细胞位置进行预测.结果表明,基于氨基酸二肽组成成分构成的特征向量集(以符号DIPE表示)的预测结果高于其它四种特征向量集的预测结果,在Jackknife检验下,总预测成功率达到了89.3%;与现有的方法比较,发现对于Mitochondrial类凋亡蛋白,支持向量机方法有更好的预测效果.(本文来源于《内蒙古大学学报(自然科学版)》期刊2008年02期)

亚细胞位置论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

了解蛋白质的亚细胞位置对于理解蛋白质的功能,蛋白质间的相互作用,药物的靶向治疗具有重要的意义。然而目前利用实验检验的方法来获取蛋白质的亚细胞位置需要耗费很大的成本和时间。因此利用蛋白质亚细胞位置预测工具来对大量的蛋白质进行预测具有重要意义。目前,领域内已经提出了一系列机器学习算法来构建模型,达到预测大规模蛋白质的亚细胞位置的目的。这些分类器关键步骤是将氨基酸序列编码成为特征向量。许多研究已经表明从生物学家所注释的生物域提取的特征,例如基因本体论特征和功能域特征,可以非常有效的提高预测准确性。然而,这些生物注释特征和功能域特征通常拥有很高的维度和大量的冗余,这可能会降低机器学习模型的性能。另外蛋白质可以同时存在于两个或更多个不同的亚细胞位置,而目前对于多亚细胞位置蛋白质的预测效果往往不是十分理想。在本篇论文中,我们提出一种新的基于氨基酸序列的人类蛋白质亚细胞定位预测方法,我们将它命名为Hum-mPLoc 3.0,在该方法中我们对12个人类亚细胞位置进行预测。我们将该蛋白质序列用不同方面的特征表示,即基因本体论(GO)注释特征,基于肽的功能结构域和基于残基的统计特征。为了系统地反映领域知识库的层次结构,我们提出一种称为HCM(隐相关性建模)的特征表示模型,其将通过对注释特征之间的隐藏的相关性建模来创建出更紧凑和更有区别性的特征向量。我们在四个数据集上与领域内其他的预测器进行了比较,实验结果表明,我们的方法能够最有效的预测人类蛋白质的亚细胞位置。同时,Hum-mPLoc 3.0对在Swiss-Prot数据库上的整个人类蛋白质组的进行了大规模应用揭示了细胞中的蛋白质共亚细胞定位偏好。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

亚细胞位置论文参考文献

[1].翟云清,翟胜楠.基于多标记学习的人类蛋白质亚细胞多位置预测[J].湖北民族学院学报(自然科学版).2018

[2].周航.基于特征隐关联建模的蛋白质亚细胞位置预测研究[D].上海交通大学.2017

[3].王晓,李辉,翟云清.基于集成学习和基因本体标注库的细胞凋亡蛋白亚细胞位置预测[J].轻工学报.2016

[4].王彤,薛建新,谭文安.利用半监督降维算法预测蛋白质亚细胞位置[J].上海第二工业大学学报.2015

[5].姜燕.基于多信息融合预测单定位和多定位凋亡蛋白质亚细胞位置[D].内蒙古大学.2015

[6].严寿江.基于氨基酸约化和位置特异性得分矩阵的蛋白质亚细胞定位预测方法研究[D].浙江理工大学.2014

[7].陈颖丽,李前忠.不同亚细胞位置的细胞凋亡蛋白质的结构特性分析[J].生物物理学报.2009

[8].陈颖丽,李前忠.不同亚细胞位置的细胞凋亡蛋白质的结构特性分析[C].第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集.2009

[9].陆文聪,钮冰,金雨欢.基于AdaBoost算法的亚细胞位置预测[C].中国化学会第26届学术年会化学信息学与化学计量学分会场论文集.2008

[10].陈颖丽,李前忠,樊国梁,杨科利.基于支持向量机的多类凋亡蛋白亚细胞位置预测[J].内蒙古大学学报(自然科学版).2008

标签:;  ;  ;  ;  

亚细胞位置论文-翟云清,翟胜楠
下载Doc文档

猜你喜欢