导读:本文包含了蛋白质编码论文开题报告文献综述及选题提纲参考文献,主要关键词:蛋白质相互作用,氨基酸序列,深度神经网络,联合叁元组自协方差
蛋白质编码论文文献综述
王雪[1](2019)在《蛋白质编码及蛋白质相互作用预测模型的研究》一文中研究指出细胞凋亡、免疫应答和代谢途径等一系列重要生命活动,均是通过蛋白质之间的相互作用来实现的。蛋白质相互作用有利于阐明生命活动的分子机制,对疾病治疗和新药开发也具有一定的指导意义。随着后蛋白质组时代的到来,积累了海量蛋白质序列数据,如何处理这些海量的数据,如何从大量的蛋白质序列数据中挖掘出蛋白质之间内在的关系,以及如何构建蛋白质之间的相互作用网络,成为当前蛋白质组学研究中亟待解决的问题。因此,本文以蛋白质相互作用为研究目标,围绕蛋白质序列的编码方法和基于氨基酸序列的蛋白质相互作用预测模型构建及模型优化等问题开展研究工作。论文主要研究内容及结果如下:(1)为了改进蛋白质相互作用的预测性能,基于深度神经网络(Deep Neural Network,DNN)结合联合叁元组(Conjoint Triads,CT)、自协方差(Auto-Covariance,AC)、局部描述符(Local Descriptor,LD)叁种蛋白质编码方法,构建了 DNN-CT、DNN-AC和DNN-LD叁种蛋白质相互作用预测模型,并采用dropout对叁种模型的预测性能进行优化。实验结果发现:dropout将DNN-CT、DNN-AC和DNN-LD 的准确率分别从 97.11%、96.84%和 95.30%提高到 98.12%、98.17%和95.60%,将 DNN-CT、DNN-AC 和 DNN-LD 的损失率分别从 27.47%、65.91%和36.23%降至14.96%、17.82%和15.34%。这些结果表明,dropout可以提高预测模型的准确率同时降低预测模型的损失率,为蛋白质相互作用预测模型的优化提供了一个可行的解决方案。(2)基于CT和AC,提出了一种新的特征编码方法:联合叁元组自协方差法(Conjoint Triad Auto Covariance,CTAC)。该方法将CTAC编码方法与深度神经网络、支持向量机、自适应提升算法和随机森林等机器学习算法相结合,构建不同的蛋白质相互作用预测模型。实验结果表明,基于CTAC编码方法的蛋白质相互作用预测模型不仅在Benchmark数据集获得较好的预测性能,在四个外部数据集上也分别获得较好的预测结果,和现有方法相比,优于现有的蛋白质序列编码方法。(3)针对现有蛋白质序列编码方法CT、AC和LD没有考虑整条氨基酸序列先后顺序关系这一缺点,提出一种基于序列矩阵(Matrix of Sequence,MOS)的蛋白质序列编码方法,该方法一方面考虑了整条氨基酸序列先后顺序关系,另一方面降低了向量空间的维数,减少了计算量,提高了训练速度。基于DNN和MOS构建了蛋白质相互作用预测模型DNN-MOS,实验结果表明DNN-MOS的预测性能优于大部分现有预测方法,给蛋白质相互作用预测的研究提供了一个新的解决思路。本文针对现有编码方法存在的问题,提出了两种新的编码方法,基于深度学习和传统机器学习结合多种编码方法构建了多个蛋白质相互作用预测模型,并采用dropout对模型进行了优化,为蛋白质相互作用预测提供了技术支持。(本文来源于《中国科学技术大学》期刊2019-10-20)
米玮,周长东[2](2019)在《卡培他滨联合全结肠系膜切除术治疗结肠癌患者临床疗效及对非编码蛋白质单链小RNA与环氧化酶2表达影响》一文中研究指出目的探讨卡培他滨联合全结肠系膜切除术治疗结肠癌患者的临床疗效及对非编码蛋白质单链小RNA(miR-101)与环氧化酶2(COX-2)的表达影响。方法选取自2009年11月至2010年11月收治的120例结肠癌患者为研究对象。采用随机数字表法将其分为A组与B组,每组各60例。A组患者仅在术后4~6周给予患者10个疗程XELOX方案化疗。B组患者在进行全结肠系膜切除术前给予患者4个疗程卡培他滨单药化疗,术后4~6周给予患者6个疗程XELOX方案化疗。观察并比较两组患者的术前病理特征、手术情况及血清miR-101、COX-2的表达水平。结果两组患者术前病理特征、手术情况比较,差异均无统计学意义(P>0.05)。治疗后,两组患者的miR-101表达水平均上升、COX-2均下降,且B组患者miR-101和COX-2表达水平的变化程度明显高于A组,差异均有统计学意义(P<0.05)。A、B两组患者不良反应发生率分别为16.7%(10/60)、10.0%(6/60),差异无统计学意义(P>0.05)。结论卡培他滨联合全结肠系膜切除术治疗结肠癌患者的治疗效果显着,患者血清miR-101明显上升,COX-2表达明显下降,患者术后复发、转移情况明显下降。(本文来源于《临床军医杂志》期刊2019年09期)
程淑萍,谭建军,门婧睿[3](2019)在《基于机器学习方法的非编码RNA-蛋白质相互作用的预测》一文中研究指出目的非编码RNA-蛋白质的相互作用(noncoding RNA-protein interactions,ncRPI)具有重要的生物学意义,目前预测其相互作用已成为当下研究非编码RNA (noncoding RNA,ncRNA)和蛋白质功能的重要途径之一。方法本研究基于ncRNA和蛋白质的序列信息提取特征,运用卷积自编码器预处理原始数据,训练叁个机器学习模型:LightGBM(LBM)、随机森林(random forest,RF)和极端梯度增强算法(extreme gradient boosting,XGB),预测ncRNA与蛋白质的相互作用。结果在RPI369和RPI488两个数据集做5倍交叉验证,LBM、RF与XGB叁个模型在两个数据集均达到较高的预测准确率,在RPI369数据集叁个模型的预测准确率分别为0. 757(LBM)、0. 791(RF)、0. 791(XGB),在RPI488数据集叁个模型的预测准确率分别为0. 918 (LBM)、0. 908 (RF)、0. 918 (XGB);叁个模型在RPI1807、RPI2241、RPI13254大数据集也取得较高的AUC(area under curve)值,在RPI1807叁个模型的AUC值均为0. 99,在RPI2241叁个模型最低AUC值为0. 87,在RPI13254叁个模型最低AUC值为0. 81,都表现出较好的预测准确性。结论机器学习方法能够预测ncRNA与蛋白质是否存在相互作用。(本文来源于《北京生物医学工程》期刊2019年04期)
张梦然[4](2019)在《生命遗传密码被成功“压缩”》一文中研究指出科技日报北京5月15日电(张梦然)生命的遗传密码并非全部必需?根据英国《自然》杂志15日在线发表的一项最新研究,英国团队成功“压缩”遗传密码——使一种合成大肠杆菌(Escherichia coli)只需有限的蛋白质合成指令,就能编码所有常见氨基酸。这(本文来源于《科技日报》期刊2019-05-16)
沈彤[5](2019)在《基于序列分段近邻编码的蛋白质热点残基预测方法研究》一文中研究指出在蛋白质与蛋白质相互作用时,其结合自由能仅由一小部分氨基酸残基贡献,这部分关键残基被称为热点残基。蛋白质功能的实现往往依赖热点残基,热点残基大部分聚集在蛋白质相互作用界面的中心位置,对蛋白质与蛋白质的结合起着至关重要的作用。因此,加深对热点残基的理解对于生命科学的发展具有积极的贡献。当前,科研工作者们主要依靠丙氨酸突变扫描技术来判定热点残基,但是这种方法成本较高又耗时耗力,只能在小范围应用。所以急需要更准确、更高效的方法来识别蛋白质界面热点残基。本文提出了序列分段近邻编码方法,并基于随机森林(Random Forest)分类算法来构建预测模型,从而鉴别蛋白质相互作用界面中的热点残基。首先从ASEdb数据库中抽取训练集,然后提取了 10个氨基酸理化属性、16个与突出指数(PI)和深度指数(DI)相关的特征以及25个与溶剂可及表面积(ASA)相关的特征。本文改进了蛋白质编码方式,对蛋白质热点残基的预测方式提供了新思路。不同于以往蛋白质序列的自相关描述符编码、叁联体组合信息编码等方式,本文考虑到与热点残基临近的氨基酸以及有一定间隔的氨基酸对热点残基的影响,调整热点残基所在区间的滑动窗口长度,并将蛋白质序列平均分割成3、4、5段,由此建立预测模型,通过交叉验证最终选取了最佳的设置参数。为了验证预测模型的可靠性,本文从BID数据库中提取出独立测试集,来验证提出的模型。最后,将本文的预测模型与现有的热点残基预测方法进行了对比,这些模型在热点残基预测研究方面具有重要意义,其中包括APIS、Robetta、FOLDEF、KFC以及MINERVA模型。在使用相同训练集构建的模型之中,本文的模型在相同测试集上,明显地提升了对蛋白质界面热点残基的预测能力,表明了本文方法的可靠性。(本文来源于《安徽大学》期刊2019-05-01)
张慧[6](2019)在《长链非编码RNA-蛋白质相互作用及疾病关联算法的研究》一文中研究指出长链非编码RNA(lncRNA)是长度大于200碱基,且可以通过折迭的方式形成稳定的空间结构,但是不能编码蛋白的RNA。随着下一代测序技术与生物信息学的发展,近年来lncRNA研究引起了越来越多的关注,深入探讨lncRNA与蛋白质的相互作用关系以及疾病关联分析是推断lncRNA功能和深入研究lncRNA的主要途径。目前lncRNA与蛋白质的互作预测仍处于初步阶段。lncRNA在众多生物学通路与生物分子功能中扮演着重要的角色,且与众多疾病的发生、发展息息相关,lncRNA通过生物大分子之间的相互作用来实现生物学功能,lncRNA最重要的分子机制之一是与蛋白质的相互作用。网络科学的兴起以及其在生物信息学领域的应用深入也为lncRNA的深入挖掘提供新的方法。目前已经有多种预测lncRNA与蛋白质相互作用的方法被提出。主要分为两大类预测lncRNA与蛋白质相互作用的方法:第一大类是基于序列、结构及理化性质的内在特征预测lncRNA与蛋白质相互作用的计算模型;第二大类是基于网络方法的外部关联预测lncRNA与蛋白质相互作用的计算模型。一方面反映了学界对lncRNA与蛋白质分子相互作用关系的这一问题有着浓厚的兴趣和一定的重视,另一反面也表现了机器学习与网络科学在探索生物领域所蕴含的远大前景。在本研究的第一部分,分别对基于机器学习与网络分析方法预测lncRNA与蛋白质相互作用的计算模型进行了系统和全面地分析与比较,归纳了这两大类计算方法的不同优缺点,以及适用范围。这部分内容不仅可以全面地展示当前lncRNA与蛋白质分子相互作用的研究进展,帮助用户在不同的数据集下选择合适的预测相互作用的方法,最终取得更加可靠的相互作用结果。在本研究的第二部分,提出了新的预测lncRNA与蛋白质分子相互作用的算法。构建异质网络,利用网络表示学习DeepWalk算法深度挖掘分子外部的关联特征以及异质网络中生物分子间的拓扑结构信息,构建多种分类器模型预测lncRNA与蛋白质的互作,并进一步与其他预测lncRNA-蛋白质互作的算法相比较,本部分提出的算法在效果和方法方面都有着良好的表现。此外,目前已收录在公开数据库中的lncRNA与疾病关联的数目相比于已经鉴定出来的lncRNA的数目是不能相提并论的,仅有极少一部分lncRNA与疾病关联的数据,为此,在本文第叁部分的研究中,构建了利用异质网络拓扑相似性的lncRNA与疾病关联的预测模型。首先构建了包括lncRNA-microRNA的相互作用、lncRNA-疾病的关联、microRNA-疾病的关联、lncRNA-lncRNA的相互作用和疾病-疾病的相互作用所组成的异质网络,基于DeepWalk得到节点的向量表示,计算拓扑相似性并基于规则推理预测潜在的lncRNA与疾病关联的计算方法。利用10折交叉验证,与同样基于网络方法预测lncRNA与疾病关联的计算模型RWRHLD和RWRlncD进行比较,并进一步基于文本挖掘对预测结果进行验证与比较,本部分提出的预测lncRNA与疾病关联的计算方法获得了令人满意的表现,并优于RWRHLD和RWRlncD算法。通过本文的研究,总结并讨论了lncRNA与蛋白质相互作用预测的计算方法,并提出了新的基于异质网络中挖掘隐藏的拓扑结构信息提取分子外部关联的特征,构建机器学习模型预测lncRNA与蛋白质相互作用的计算方法。此外,构建lncRNA与疾病关联的异质网络,基于拓扑相似性质的关联规则预测lncRNA与疾病关联。通过本文的工作可以有助lncRNA的功能推断,全面推动lncRNA的研究。(本文来源于《吉林大学》期刊2019-05-01)
金刚,王丽萍,龙凌云,吴凤,唐玉娟[7](2019)在《普通野生稻线粒体蛋白质编码基因密码子使用偏好性的分析》一文中研究指出以普通野生稻(Oryza rufipogon Griff.)线粒体基因组为对象,分析其蛋白质编码基因的密码子使用特征及与亚洲栽培稻(O. sativa L.)的差异,探讨其密码子偏性形成的影响因素和进化过程。结果显示:普通野生稻线粒体基因组编码序列第1、第2和第3位碱基的GC含量依次为49.18%、42.67%和40.86%;有效密码子数(Nc)分布于45.32~61.00之间,其密码子偏性较弱; Nc值仅与GC_3呈显着相关,密码子第3位的碱基组成对密码子偏性影响较大;第1向量轴上显示9.91%的差异,其与GC_(3s)、Nc、密码子偏好指数(CBI)和最优密码子使用频率(Fop)的相关性均达到显着水平;而GC_3和GC_(12)的相关性未达到显着水平。因此,普通野生稻线粒体基因组密码子的使用偏性主要受自然选择压力影响而形成。本研究确定了21个普通野生稻线粒体基因组的最优密码子,大多以A或T结尾,与叶绿体密码子具有趋同进化,但是与核基因组具有不同的偏好性。同义密码子相对使用度(RSCU)、PR2偏倚分析和中性绘图分析显示,普通野生稻线粒体基因功能和其密码子使用密切相关,且线粒体密码子使用在普通野生稻、粳稻(O. sativa L. subsp. japonica Kato)和籼稻(O. sativa L. subsp.indica Kato)内具有同质性。(本文来源于《植物科学学报》期刊2019年02期)
陈行健,胡雪娇,薛卫[8](2019)在《基于多层次稀疏编码预测蛋白质亚细胞定位》一文中研究指出文中提出了一种简单有效的蛋白质亚细胞区间定位预测方法,为进一步了解蛋白质的功能和性质提供理论基础。运用稀疏编码,结合氨基酸组成信息提取蛋白质序列特征,基于不同字典大小对得到的特征进行多层次池化整合,并送入支持向量机进行分类。经Jackknife检验,在数据集ZD98、CH317和Gram1253上的预测成功率分别达到95.9%、93.4%和94.7%。实验证明基于多层次稀疏编码的分类预测算法能显着提高蛋白质亚细胞区间定位的预测精度。(本文来源于《生物工程学报》期刊2019年04期)
邓蕾,庞舒尹,杨丽媛,代玉梅,刘云锋[9](2018)在《人类全基因组编码蛋白质芯片技术筛选胆道闭锁自身免疫靶抗原》一文中研究指出目的筛选胆道闭锁(biliary atresia,BA)自身免疫相关靶抗原,建立疾病差异性抗原谱,寻找疾病诊断及发病机制研究线索。方法以20例BA患儿、5例疾病对照组患儿(包括婴儿肝炎综合征2例、胆总管囊肿3例)和5例正常儿童对照组的血清为探针,采用全基因组蛋白质芯片技术进行检测,并进行生物学聚类分析和GO功能分析。结果通过比较BA组与对照组,共筛选出存在明显差异的免疫响应蛋白281个,其中Ig G响应105个,Ig M响应176个,Ig G和Ig M同时响应的26个;依据差异倍数≥2、表达稳定的标准得出49个高响应蛋白。GO功能分析发现差异抗原主要涉及调控细胞发育、增殖、凋亡及胆道形成。其中CENP6、UBQLN3、PDCD2、SPEG和RBPJ蛋白在BA组中阳性率显着高于正常对照组(100%vs 0%,P<0.05)。结论成功建立BA相关自身抗原差异谱,为BA的早期诊断、发病机制的阐明提供新的科学依据,但仍需更为深入的鉴定和更多临床样本的验证。(本文来源于《临床检验杂志》期刊2018年10期)
王亚琪,郭敏,刘铮铸,耿立英,张传生[10](2018)在《美洲水貂TYRP1基因编码蛋白质结构及功能的生物信息学分析》一文中研究指出基于生物基因组学数据库,对美洲水貂酪氨酸酶相关蛋白质1(TYRP1)基因进行生物信息学分析,为其遗传特性及编码蛋白质功能机制的研究提供基础数据。生物信息学分析结果表明,美洲水貂TYRP1基因共编码537个氨基酸,其编码产物为不稳定的亲水蛋白质。二级结构主要以α-螺旋和无规卷曲为主,含有1个酪氨酸酶超家族结构域,存在信号肽、跨膜结构域和二硫键。该蛋白质主要在内质网中发挥细胞被膜、运输和结合的作用,同时还通过信号转导在细胞内发挥其生物学作用。系统进化情况和动物分类学基本一致,美洲水貂和雪貂的亲缘关系最近。美洲水貂TYRP1基因编码蛋白质在生物进化中具有较强保守性,该基因结构和功能的分析为水貂TYRP1基因遗传特性的进一步研究奠定了基础。(本文来源于《江苏农业科学》期刊2018年20期)
蛋白质编码论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
目的探讨卡培他滨联合全结肠系膜切除术治疗结肠癌患者的临床疗效及对非编码蛋白质单链小RNA(miR-101)与环氧化酶2(COX-2)的表达影响。方法选取自2009年11月至2010年11月收治的120例结肠癌患者为研究对象。采用随机数字表法将其分为A组与B组,每组各60例。A组患者仅在术后4~6周给予患者10个疗程XELOX方案化疗。B组患者在进行全结肠系膜切除术前给予患者4个疗程卡培他滨单药化疗,术后4~6周给予患者6个疗程XELOX方案化疗。观察并比较两组患者的术前病理特征、手术情况及血清miR-101、COX-2的表达水平。结果两组患者术前病理特征、手术情况比较,差异均无统计学意义(P>0.05)。治疗后,两组患者的miR-101表达水平均上升、COX-2均下降,且B组患者miR-101和COX-2表达水平的变化程度明显高于A组,差异均有统计学意义(P<0.05)。A、B两组患者不良反应发生率分别为16.7%(10/60)、10.0%(6/60),差异无统计学意义(P>0.05)。结论卡培他滨联合全结肠系膜切除术治疗结肠癌患者的治疗效果显着,患者血清miR-101明显上升,COX-2表达明显下降,患者术后复发、转移情况明显下降。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
蛋白质编码论文参考文献
[1].王雪.蛋白质编码及蛋白质相互作用预测模型的研究[D].中国科学技术大学.2019
[2].米玮,周长东.卡培他滨联合全结肠系膜切除术治疗结肠癌患者临床疗效及对非编码蛋白质单链小RNA与环氧化酶2表达影响[J].临床军医杂志.2019
[3].程淑萍,谭建军,门婧睿.基于机器学习方法的非编码RNA-蛋白质相互作用的预测[J].北京生物医学工程.2019
[4].张梦然.生命遗传密码被成功“压缩”[N].科技日报.2019
[5].沈彤.基于序列分段近邻编码的蛋白质热点残基预测方法研究[D].安徽大学.2019
[6].张慧.长链非编码RNA-蛋白质相互作用及疾病关联算法的研究[D].吉林大学.2019
[7].金刚,王丽萍,龙凌云,吴凤,唐玉娟.普通野生稻线粒体蛋白质编码基因密码子使用偏好性的分析[J].植物科学学报.2019
[8].陈行健,胡雪娇,薛卫.基于多层次稀疏编码预测蛋白质亚细胞定位[J].生物工程学报.2019
[9].邓蕾,庞舒尹,杨丽媛,代玉梅,刘云锋.人类全基因组编码蛋白质芯片技术筛选胆道闭锁自身免疫靶抗原[J].临床检验杂志.2018
[10].王亚琪,郭敏,刘铮铸,耿立英,张传生.美洲水貂TYRP1基因编码蛋白质结构及功能的生物信息学分析[J].江苏农业科学.2018