二级结构预测论文-吴阳开,范文胜,张雪莲,李智丽,郭锦玥

二级结构预测论文-吴阳开,范文胜,张雪莲,李智丽,郭锦玥

导读:本文包含了二级结构预测论文开题报告文献综述及选题提纲参考文献,主要关键词:新型鸭呼肠孤病毒(NDRV),σB蛋白,基因特征,二级结构

二级结构预测论文文献综述

吴阳开,范文胜,张雪莲,李智丽,郭锦玥[1](2019)在《新型鸭呼肠孤病毒QY株σB蛋白基因特征、二级结构预测及其细胞抗原表位分析》一文中研究指出本研究旨在对新型鸭呼肠孤病毒(NDRV) QY株σB蛋白的遗传变异规律和结构及功能进行分析。从GenBank数据库中获取QY株和25株参考株的σB蛋白编码序列,通过Mega 6.0软件进行序列比对分析和系统进化树构建;使用Datamonkey软件进行选择压力分析;运用生物信息学软件预测QY株σB蛋白二级结构功能及B细胞和T细胞抗原表位。相似性分析结果显示,NDRV QY株与国内其他地区分离的鸭呼肠孤病毒(DRV)氨基酸相似性达到94.9%~98.9%,与禽呼肠孤病毒(ARV)及番鸭呼肠孤病毒(MDRV)的相似性仅为66.5%~68.4%和67.6%~68.4%;选择压力分析显示,σB蛋白承受净化选择压力,但存在一个正向选择位点;σB蛋白属于亲水蛋白,不具有信号肽和跨膜区,含有潜在的O-糖基化位点;结构预测分析显示,σB蛋白具有α-螺旋、β-折迭、β-转角及无规则卷曲等丰富的二级结构;表位分析显示,σB蛋白含有潜在的B细胞和T细胞抗原表位。本研究成功进行了QY株σB蛋白的基因特征和结构功能预测及其细胞表位分析,为深入了解该蛋白的免疫学特性及研发NDRV新型疫苗奠定了基础。(本文来源于《中国畜牧兽医》期刊2019年10期)

吴宏杰,汤烨,陆卫忠,崔志明,付保川[2](2019)在《一种自适应序列长度的RNA二级结构深度预测方法》一文中研究指出RNA二级结构预测是结构生物信息学中的一个重要问题.带假结的RNA二级结构预测,由于复杂的假结结构,更是增加了预测的难度.传统的机器学习方法受限于学习模型的结构,输入特征数目必须固定.大部分方法将不同长度的序列统一截断后进行训练,这不仅导致有用信息丢失,而且并破坏了生物序列完整性.针对该问题提出了一种适应序列长度的深度递归神经网络模型,构造了序列长度自适应模块及训练算法,从而不需要截断.同时,由于实际样本比例不均衡,采用了动态加权方法进行改善.随后,在权威数据集RNA STRAND上与四种优秀方法进行了四组比较实验.实验结果表明,本方法的正确率和M atthew s相关系数比定长LSTM方法分别提高了1. 6%和3. 3%;比其它四种典型方法提高了13. 6%和14. 8%.(本文来源于《小型微型计算机系统》期刊2019年08期)

李熹,杨运煌[3](2019)在《基于激光光谱分析的RNA二级结构预测》一文中研究指出基于副本交换的局部增强差分进化蛋白质结构预测方法,对RNA二级结构进行预测时,信息的筛选不够充分,预测性能差。提出基于激光光谱分析的RNA二级结构预测方法,采用基于激光光谱能量的动态划分算法搜索光谱能量最细微的光谱茎区,通过Hopfield网络算法预测RNA二级结构时,采用贪心算法获取待测RNA光谱茎区池,使用动态规则方法对RNA双光谱序列里光谱能量最细微的RNA光谱茎区和光谱茎区池区间隔进行比照,间隔过长的光谱茎区通过Hopfield神经网络的运算"变短"从而减少干扰,RNA光谱茎区池里的光谱茎区用其预测值进行更正,实现RNA光谱茎区池的改进,再通过贪心算法和Hopfield神经网络基于改进后的RNA光谱茎区池对RNA二级结构进行预测。实验表明,所提方法对RNA二级结果预测性能的最高均值是96. 98%,平均预测时间为6. 2 s,预测性能高。(本文来源于《激光杂志》期刊2019年06期)

李艳萍[4](2019)在《基于决策森林的蛋白质二级结构预测算法研究》一文中研究指出蛋白质是人类机体的重要组成并且机体内几乎所有的活动都需要具有特定功能的蛋白质参与。蛋白质的空间结构决定其主要功能。因此对于蛋白质结构的研究有助于更好的了解它的功能。但并不能直接通过模拟蛋白质的折迭过程来了解它的空间结构。然而蛋白质是由氨基酸序列组成的,因此,通过氨基酸序列来预测蛋白质的二级结构进而了解它的叁维构象便成为了一种常用的方法。在大数据、云计算和人工智能快速发展的时代背景下,采用机器学习的方法对蛋白质的二级结构进行预测已经成为生物信息学中的一个研究热点。基于决策树森林模型及机器学习技术,本文深入研究了蛋白质的八类二级结构预测,主要研究内容如下:针对蛋白质的八类二级结构预测问题,提出了一种基于梯度提升的决策森林预测算法。该算法基于氨基酸序列的PSSM谱特征采用交叉熵损失函数的二阶泰勒近似作为优化目标,以决策树确定的映射函数作为优化参数,通过贪婪地在特征值上选取最佳分裂点来构造决策树。此外,为了防止过拟合,进一步在目标函数中引入了_2L正则化项,以便控制模型的复杂度。在标准的CB513蛋白质二级结构评估数据集上,本文提出的算法达到了64.89%的_8Q准确率。针对梯度提升决策森林算法运行速度慢的缺点,本文基于直方图思想提出了一种快速梯度提升的预测模型。该模型通过直方图的方法将样本特征离散化,对于大量的样本数据采用单边梯度技术对数据进行采样,并采用特征绑定技术对多维特征进行降维,实现了样本数量和特征两个维度的并行。通过大量的实验对影响模型性能的指标进行分析,实验结果表明,基于本文所提出的快速梯度提升算法对蛋白质的二级结构进行预测,在测试集上的_8Q准确率达到了66.35%。另外,在同样的数据集上,相对于其他算法来比较,本文所提出的算法运行速度非常快,时间复杂度很小。(本文来源于《河南大学》期刊2019-06-01)

王蕾蕾[5](2019)在《基于条件随机场与深度学习的蛋白质二级结构预测》一文中研究指出随着生物信息学的发展,蛋白质数据库中的蛋白质序列信息越来越多,尤其是生物信息学的出现,使得人们能够更好地利用这些蛋白质信息了解生物系统。生物信息学可以利用这些序列信息寻找相关的蛋白质,并收集其他信息推测未知蛋白质的结构和功能等可能的特性。蛋白质结构分析预测也经常被用在药物设计中。通过实验方法获取蛋白质二级结构所需的成本高,专业人才紧缺,所以目前面临的核心问题就是利用生物信息学找到一种能够高效地预测蛋白质二级结构的算法。本文使用深度学习算法和条件随机场算法对蛋白质二级结构进行预测。在蛋白质数据处理中,本文用到了位置特异性矩阵(Position-Specific Scoring Matrix,PSSM),同时为了更好的表示氨基酸序列,使用了滑动窗口技术。在蛋白质二级结构预测算法方面,本文提出了两种学习分类方法:第一种是卷积神经网络结合Softmax分类器的算法,此方法改进了卷积神经网络的模型结构,针对梯度消失问题在各卷积层之后添加了修正线性单元(Rectified Linear Units,ReLU)激活层,为了最大限度地保留原始数据的重要特征,提取了全连接层之前的特征数据作为Softmax分类器的输入,对蛋白质二级结构进行分类和预测,与传统的卷积神经网络方法比较,此方法提高了预测精度。第二种是基于集成学习的思想:使用了一种简单的集成策略把卷积神经网络和条件随机场模型进行了结合,使得这两种学习器最大限度的发挥自身的优势同时弥补彼此的缺点,最后用本文的集成分类器对蛋白质二级结构进行分类和预测,提高了预测的精度。实验证明,本文提出的两种方法在公开的蛋白质数据集25PDB数据集上准确率有所提高。实验证明,由卷积神经网络和条件随机场模型基于集成学习策略组成的集成学习器在25PDB数据集上的预测准确率高于CNN-Softmax网络模型,所以,深度学习算法与条件随机场模型结合可以更好地提高蛋白质二级结构的预测准确率。(本文来源于《齐鲁工业大学》期刊2019-05-31)

王剑[6](2019)在《基于分组式的多分类器的蛋白质二级结构预测的算法研究》一文中研究指出蛋白质二级结构预测是蛋白质结构预测和理解蛋白质结构和功能的重要课题,主要工作是依据蛋白质氨基酸序列的编码特征正确识别出对应的蛋白质二级结构标签。本文采用25PDB蛋白质序列数据集,采用PSSM编码﹑正交编码和滑动窗口方法将氨基酸处理成伪图像对蛋白质二级结构预测做了研究,在研究过程中选定了叁种训练模型,分别是卷积神经网络﹑LSTM神经网络和随机森林。每个训练模型对应一个分组实验,在每个分组实验中对训练模型做了训练模型的优化设计:在基于卷积神经网络的分组实验中,设计了一个包含两个网络结构单元的一般卷积神经网络,每个网络单元包含主要的卷积层和下采样层,因为蛋白质氨基酸的伪图像对于卷积神经网络来说相对于真正的图像而言数据量较少,所以本文设计了一个可以增加输入冗余,解决一般卷积神经网络梯度偏离的残差卷积神经网络,实验证明这种卷积神经网络更加稳定,预测更准确。在基于LSTM神经网络的分组实验中,分别对伪图像在两个维度上切片生成序列数据对于一般的LSTM神经网络做了实验,因为直接切片会破坏蛋白质氨基酸序列的上下文特,所以本文采用滑动窗口操作在蛋白质序列维度生成了多个BP神经网络隐层,将这些BP神经网络隐层神经元的输出当作序列数据输入LSTM神经网络,实验证明添加BP神经网络隐层的LSTM神经网络能更好的提取蛋白质序列的上下文特征。在基于随机森林的分组实验中,本文将残差卷积神经网络在最后一个平均池化层提取的样本特征作为随机森林的输入,相当于为随机森林做了一个特征提取器,实验证明添加了特征提取器的随机森林预测结果会有很大提升。在分组实验结束之后,本文利用ensemble方法将实验中叁种优化设计之后的模型进行了整合,将残差卷积神经网络﹑加入了BP神经网络隐层的LSTM神经网络和添加了特征提取器的随机森林模型在每个蛋白质二级标签上的输出概率相加,取最大概率对应的标签作为ensemble模型的输出,实验证明ensemble模型相对于叁类成员模型的预测结果均有提高。(本文来源于《齐鲁工业大学》期刊2019-05-31)

吕育林[7](2019)在《基于模拟退火的RNA二级结构预测算法研究》一文中研究指出RNA分子在生物细胞中起着关键作用,分子中的碱基在氢键的作用下相互绑定形成不同的二级结构。虽然动态规划算法可以高效求解不含假结的二级结构,但RNA分子的假结对细胞功能具有重要影响,这种结构破坏了相互嵌套碱基对规则,使得传统的动态规划算法无法成功求解该问题。随着分子序列长度的增加,RNA分子的碱基配对组合呈指数量级增长,含假结的RNA二级结构预测问题已被证明为NP完全问题。目前,国内外许多研究者提出了许多不同的含假结的RNA二级结构预测算法,但是这些算法都存在着一些不足之处。其中,序列比较分析类的算法预测精度高,但是该算法依赖于大量已知的同源序列信息;动态规划类的算法收敛速度慢且在预测长链RNA序列时预测精度不高。因此,不论采用目前哪种算法进行预测仍存在一些问题,构建一个有效的算法来提高预测含假结的RNA分子二级结构的精确度就显得尤为重要。本文将预测问题转换成等价的组合优化问题后,提出了一种基于模拟退火的含假结的RNA二级结构预测算法。首先根据最小茎区长度和最小环区长度两个约束条件,设计了一种高效的碱基互补配对方式并为发生冲突的碱基提供了详细的冲突解决方案。然后将RNA序列的茎区数量和碱基配对总数作为评价RNA二级结构的因子,提出一种简单且有效的适应度评价函数。本文从PseudoBase数据库中随机选择了15个测试序列,并与IPknot、TT2NE和HotKnots等其他领先的预测算法进行对比实验,实验结果验证了本算法的有效性。根据上述评价函数的两个因子,可以将含假结的RNA二级结构预测问题转换成多目标最小化问题。因此本文在上述算法基础上,提出一种基于多目标模拟退火的长链RNA二级结构预测算法。首先详细定义了所提出算法不同解之间的支配关系,然后为确保帕托前沿上的解分布均匀,设计了一种增加RNA二级结构多样性的策略,最后通过近邻热力学参数计算出帕累托前沿中最稳定的RNA二级结构。与其它算法进行对比,实验结果表明本文所提出的算法具有预测长链RNA二级结构的能力。(本文来源于《武汉科技大学》期刊2019-05-01)

张春鹤[8](2019)在《基于卷积神经网络的RNA二级结构预测方法研究》一文中研究指出近年来,探知RNA二级结构一直是RNA研究领域的重要和难点问题。目前虽然部分RNA的二级结构可以通过实验手段获取,但在大多数情况下仍然需要采用计算机预测方法来预测RNA二级结构预测。当前RNA二级结构的预测方法主要是基于最小自由能的动态规划类算法,通过迭代的方式找到满足能量最小或其他限制条件的RNA体内折迭最佳状态来预测RNA结构。但是由于生物体内环境的复杂性使得RNA的真实结构并不能满足能量最小的最佳折迭状态,而是一种基于生物势能平衡状态。对于序列较短的RNA,折迭生物势能平衡状态接近最小自由能状态,最小自由能的算法可以获得较高的准确率。然而对于较长的RNA序列,其结构复杂,在体内生物环境中存在反复折迭导致其生物势能平衡状态远远偏离最小自由能状态,使得使用基于传统能量方法预测精度严重下降,无法准确预测RNA二级结构。深度学习方法是一种常见的表示学习方法,能够自动的从数据中挖掘出有效分类的隐藏特征。本文基于深度学习和现有真实RNA二级结构数据,提出一种应用卷积神经网络模型结合动态规划算法的新型RNA二级结构预测方法CDPfold。该方法基于现有实验已经得出的真实RNA结构数据,构建深度卷积网络模型,从大规模RNA序列数据及其结构数据中挖掘有效分类的隐含特征,并以此为依据预测出每一个碱基的配对概率。对于得到的概率结果,应用动态规划的计算思想,得到满足RNA二级结构定义且各个碱基的匹配概率之和最大的RNA二级结构作为预测的最终结果。本文通过对已知结构的RNA进行编码,应用卷积神经网络对RNA序列上的每个碱基配对情况进行预测,最后应用动态规划方法对预测结果进行组合,可以得到预测出的RNA最优二级结构。实验结果表明,CDPfold在5sRNA、tRNA和srpRNA这3个RNA家族的预测上,相较于其他常见的RNA二级结构预测算法,其敏感性和特异性均提高了30%左右。另外由于深度学习方法的性能与数据量的大小直接相关。由此可以推测出随着经过生物实验验证的真实RNA结构数据的不断增加,应用本文所提出的方法对各类RNA家族的预测精度也会不断的提高。(本文来源于《吉林大学》期刊2019-04-01)

朱树平,刘毅慧[9](2019)在《蛋白质二级结构在线服务器预测评估》一文中研究指出蛋白质二级结构的预测,对于研究蛋白质的功能和人类生命科学意义非凡。1951年开始提出预测蛋白质二级结构,1983年对于二级结构的预测只有50%的准确率。经过多年的发展,预测方式不断的改进和完善,到如今准确率已经超过80%。但目前预测在线服务器繁多,连续自动模型评估(CAMEO)也只给出服务器叁级结构的预测评估,二级结构评估还未实现。针对上述问题,选取了以下6个服务器:PSRSM、MUFOLD、SPIDER、RAPTORX、JPRED和PSIPRED,对其预测的二级结构进行评估。并且为保证测试集不在训练集内,实验数据选取蛋白质结构数据库(Protein Data Bank,PDB)最新发布的蛋白质。在基于蛋白质同源性30%、50%和70%的实验中,PSRSM取得Q3的准确率分别为91.44%、88.12%和90.17%,比其他预测服务器中最高的MUFOLD分别高出3.19%、1.33%和2.19%,证明在同一类同源性数据中PSRSM比其他服务器有更好的预测效果。除此之外实验也得到其预测的Sov准确度也比其他服务器要高。比较各类服务器的方法与结果,得出今后蛋白质二级结构预测应当重点从大数据、模板和深度学习的角度进行研究。(本文来源于《生物信息学》期刊2019年01期)

刘虹,薛青,黄文,覃瑞[10](2018)在《茶藨子属ITS2序列二级结构的预测和比较分析》一文中研究指出目的:利用内转录间隔区2(ITS2)序列对茶藨子属30个物种进行分类鉴定.方法:利用Clustal W软件多序列比对分析从Genbank上下载的ITS2序列,通过MEGA7.0软件计算遗传距离(K2P),基于K2P模型构建邻接(NJ)聚类树,并用RNA Structure5.4软件分析各物种ITS2二级结构的差异.结果:从构建的聚类树可知,茶藨子属30个物种均聚为1大枝11个小分枝,说明茶藨子属是一个单系类群;根据ITS2的二级结构分析,该属所有物种都均具有相似的结构,说明了该属的特异性较强,同时也说明了ITS2序列分析适用于茶藨子属植物的分类鉴定,并在近缘物种间的系统学研究、物种的鉴定方面具有较大的应用潜力.(本文来源于《中南民族大学学报(自然科学版)》期刊2018年03期)

二级结构预测论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

RNA二级结构预测是结构生物信息学中的一个重要问题.带假结的RNA二级结构预测,由于复杂的假结结构,更是增加了预测的难度.传统的机器学习方法受限于学习模型的结构,输入特征数目必须固定.大部分方法将不同长度的序列统一截断后进行训练,这不仅导致有用信息丢失,而且并破坏了生物序列完整性.针对该问题提出了一种适应序列长度的深度递归神经网络模型,构造了序列长度自适应模块及训练算法,从而不需要截断.同时,由于实际样本比例不均衡,采用了动态加权方法进行改善.随后,在权威数据集RNA STRAND上与四种优秀方法进行了四组比较实验.实验结果表明,本方法的正确率和M atthew s相关系数比定长LSTM方法分别提高了1. 6%和3. 3%;比其它四种典型方法提高了13. 6%和14. 8%.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

二级结构预测论文参考文献

[1].吴阳开,范文胜,张雪莲,李智丽,郭锦玥.新型鸭呼肠孤病毒QY株σB蛋白基因特征、二级结构预测及其细胞抗原表位分析[J].中国畜牧兽医.2019

[2].吴宏杰,汤烨,陆卫忠,崔志明,付保川.一种自适应序列长度的RNA二级结构深度预测方法[J].小型微型计算机系统.2019

[3].李熹,杨运煌.基于激光光谱分析的RNA二级结构预测[J].激光杂志.2019

[4].李艳萍.基于决策森林的蛋白质二级结构预测算法研究[D].河南大学.2019

[5].王蕾蕾.基于条件随机场与深度学习的蛋白质二级结构预测[D].齐鲁工业大学.2019

[6].王剑.基于分组式的多分类器的蛋白质二级结构预测的算法研究[D].齐鲁工业大学.2019

[7].吕育林.基于模拟退火的RNA二级结构预测算法研究[D].武汉科技大学.2019

[8].张春鹤.基于卷积神经网络的RNA二级结构预测方法研究[D].吉林大学.2019

[9].朱树平,刘毅慧.蛋白质二级结构在线服务器预测评估[J].生物信息学.2019

[10].刘虹,薛青,黄文,覃瑞.茶藨子属ITS2序列二级结构的预测和比较分析[J].中南民族大学学报(自然科学版).2018

标签:;  ;  ;  ;  

二级结构预测论文-吴阳开,范文胜,张雪莲,李智丽,郭锦玥
下载Doc文档

猜你喜欢