计算机辅助性质预测论文-李贡宇,乔连生,陈茜,陈艳昆,刘思佳

计算机辅助性质预测论文-李贡宇,乔连生,陈茜,陈艳昆,刘思佳

导读:本文包含了计算机辅助性质预测论文开题报告文献综述及选题提纲参考文献,主要关键词:计算机辅助水解,寡肽,芝麻,支持向量机

计算机辅助性质预测论文文献综述

李贡宇,乔连生,陈茜,陈艳昆,刘思佳[1](2018)在《基于计算机辅助水解技术的芝麻寡肽体内转运性质预测》一文中研究指出目的基于计算机辅助技术预测芝麻寡肽的体内转运性质。方法收集芝麻中主要蛋白序列,以计算机辅助技术进行蛋白模拟消化水解,将水解获得的寡肽构建虚拟结构数据库。构建寡肽转运蛋白2(Pep T2)底物的支持向量机(SVM)模型后,通过数据处理和参数寻优方法挑选最优模型,预测芝麻Pep T2的底物成分。结果芝麻寡肽数据库共包括346条寡肽,利用筛选获得45个描述符,创建了Pep T2底物的SVM模型,模型的准确度、灵敏度和特异性均在85%以上。经受试者工作特征(ROC)分析,其曲线下面积(AUC)>0.9。利用Pep T2底物模型预测芝麻寡肽数据库,发现36%的芝麻寡肽具有通过Pep T2转运的潜在活性。结论利用计算机辅助水解技术构建了中药芝麻寡肽数据库,以Pep T2底物SVM模型预测芝麻寡肽的体内转运性质,模型准确、稳定、灵敏、特异性高,为开展寡肽类中药成分的性质研究提供了新的方法。(本文来源于《北京中医药大学学报》期刊2018年03期)

席莉莉[2](2010)在《计算机辅助药物和蛋白性质预测研究》一文中研究指出近些年来,组合化学和高通量筛选技术的不断发展产生了大量化学、生物和药物等方面的相关数据。但是,得到化合物小分子的结构以及生物大分子的序列和结构的速度远远大于得到其相对应的性质和功能数据的速度,这在一定程度上阻碍了研究者们对知识的探索。而计算机辅助方法则提供了一条可取的有效途径。本论文所关注的就是利用计算机辅助的方法对蛋白质大分子、药物小分子的性质进行预测研究,以及对配体-蛋白质相互作用模式和相关生理活性进行预测研究。一方面的目的是利用已知数据建立准确、快速的预测模型,以对未知样本的性质进行预测;另一方面的目的是通过对所建立的预测模型的解释,期望在一定程度上揭示影响性质的关键因素,能够为样本的优化提供有用的信息;最后,期望计算机辅助预测这种方法以及所建立的预测模型能够应用于实际中,有助于筛选出符合研究者要求的化合物分子,节约实验成本、提高筛选速度、缩短实验周期。论文的第一章概述了计算机辅助性质预测方法的基本原理,从数据的获取和处理、研究样本的特征表示、模型的建立、评价和验证这些方面进行了详细的阐述。另外,介绍了计算机辅助配体-蛋白结合模式预测—分子对接方法的原理。最后,对本论文所使用的算法进行了介绍。论文的第二章,我们将计算机辅助性质预测方法应用于蛋白质大分子的性质预测。具体研究内容是蛋白质折迭过程中最基本的两个方面:蛋白质折迭速率的定量预测和蛋白质折迭途径类型的模式识别研究。在第一个研究工作中,完全从蛋白质序列角度出发,采用氨基酸序列自相关方法对101条蛋白质序列进行了表征,基于遗传算法选择出来的关键特征,分别采用全局(multiple linear regression, MLR)和局部(local lazy regression, LLR)模型来预测蛋白质的折迭速率,结果显示局部模型的预测能力优于全局模型。而且,3-fold、5-fold和10-fold交互检验的结果也表明了局部模型具有很好的预测能力和稳定性。此外,我们还分析了影响蛋白质折迭速率的关键特征:未折迭的熵变、疏水作用、二级结构偏好以及残基柔性。在第二个研究工作中,同样地,完全从蛋白质序列角度出发,采用氨基酸序列自相关方法对101条蛋白质序列进行了表征,使用支持向量机-递归特征消除(Support Vector Machine-Recursive Feature Elimination, SVM-RFE)对所有计算得到的特征根据其支持向量的权重进行重要性排序,通过抽一法(leave-one-out, LOO)交互检验的结果,最小二乘支持向量机(least square-support vector machines,LS-SVMs)方法最终使用排在前7个的重要特征建立了分类模型,准确率为91.09%,Matthews相关系数为80.88%。3-fold、5-fold和10-fold交互检验的结果也显示了所建立的预测模型的预测能力和稳定性。另外,我们还分析了氨基酸性质对蛋白折迭途径类型的影响,比如未折迭的自由能、疏水性、二级结构分布以及电荷分布等。论文的第叁章,我们将计算机辅助法应用于配体-蛋白的相互作用模式和相互作用强度的预测。在第一个研究工作中,采用从蛋白、配体和蛋白-配体复合物角度出发的组合分子建模方法分析了58个分子对白明胶酶MMP-2和MMP-9的结构-活性关系和结合模式。(1)蛋白角度:蛋白分子的序列比对和结构迭合能够更好地了解蛋白的活性位点信息;(2)抑制剂小分子角度:QSAR研究可以准确预测小分子的抑制活性,并提供影响活性的关键结构特征的信息;(3)蛋白-配体复合物角度:分子对接研究能够识别关键残基以及更好地理解蛋白-配体的关键相互作用。这种从多角度出发的研究策略能够提供很多重要的信息,并且为将来设计新的MMPs抑制剂分子提供了一种思路。在第二个研究工作中,以一系列新型MMP-13抑制剂分子为研究对象,关注了QSAR研究中的两个重要问题:活性构象的选取和描述符的表征。在MMP-13受体结构已知的情况下,通过精确的分子对接程序Glide将所有待研究的化合物分子对接到MMP-13的活性位点处,获得化合物分子的活性构象。在描述符表征部分,使用了配体分子的结构描述符、ADME性质相关的描述符以及表征配体和蛋白相互作用的描述符,通过遗传算法选择出影响化合物分子抑制活性的关键描述符,同时建立了MLR模型(全局模型),内部检验和外部检验都证明了其具有稳定性和预测能力。考虑到局部模型的优势,我们还建立了LLR模型,与全局模型相比,局部模型能显着提高模型的预测能力。论文的第四章,我们将计算机辅助性质预测方法应用于类药分子ADME/Tox相关性质的预测研究中。在第一个研究工作中,选取CYP2C19作为研究对象,基于7750个结构多样性的化合物分子,采用随机森林(random forest, RF)方法建立了识别CYP2C19底物分子的分类模型。基于6200个训练集样本,RF选出了19个重要的描述符,并且建立了分类模型,然后对1550个外部测试集样本进行了预测,结果显示外部测试集的预测准确率可达93.42%,Matthews相关系数达到80.36%。所建立的RF模型运行速度快,且识别精确度高,可以在药物研发的早期阶段用于识别CYP2C19的底物分子,从理论水平上为设计药物分子的研究者提供有用的信息,减少通过代谢导致的药物-药物相互作用的发生概率,提高药物的有效性、安全性。在第二个研究工作中,基于947个结构多样性的化合物分子,采用SVM-RFE方法对计算得到的描述符根据其支持向量的权重进行了重要性排序,用LS-SVMs方法建立了识别是否能引起药物性肝损伤的化合物分子的分类模型。基于710个训练集样本,通过LOO交互检验的结果,LS-SVMs最终使用排在前15个的重要描述符建立了分类模型,准确率达到76.48%,对237个外部测试集样本的预测准确率可达到70.04%。所建立的分类模型可以应用于判断化合物分子是否能引起人类肝细胞毒性,尤其是对能引起肝毒性的化合物分子的判断非常准确,说明理论计算方法是一种非常有效的预测工具,可以应用到其他许多ADME/Tox相关性质的预测上,并且可以在新药研发的早期阶段为研究者提供有用的信息,可能在一定程度上提高药物的筛选速度。(本文来源于《兰州大学》期刊2010-04-01)

陈昱学[3](2009)在《计算机辅助药物ADME性质预测新方法研究》一文中研究指出90年代末以来,药物发展研究表明导致昂贵的药物后期开发失败的其中一个非常重要原因是不良的药物代谢动力学和动物毒性(即ADMET)性质。药物代谢动力学性质反映了药物在生物体内吸收(absorption,A)、分布(distribution,D)、代谢(metabolism,M)、排泄(excretion,E)的规律。药物早期ADMET性质研究主要以人类组织功能性蛋白质为“药靶”,结合体外研究技术与计算机模拟等方法,探索药物在生物体内的作用。药物早期ADMET性质评价方法可显着地提高药物研发的成功率,降低药物的开发成本,减少药物毒性和副作用的发生,并能指导临床合理用药。由此可见,理论预测ADMET性质是很有意义的。药物的各种代谢动力学性质是由其化学结构和理化性质所决定。改变药物的化学结构和理化性质可导致生物活性的变化。定量构效关系(quantitativestructure-activity/property relationship,QSA/QSPR)就是通过一些数理统计方法建立化合物的生理活性或某种性质与其分子结构之间的定量关系。通过这些定量关系,可以预测化合物的生理活性或某些性质,指导合成设计出具有更高活性的化合物。定量构效关系是应用得最为广泛的药物设计方法之一。本论文第一章是药物的ADMET性质的相关介绍和定量结构活性/性质关系(QSAR/QSPR)的原理方法。下面分别简单介绍我们使用QSPR/QSAR理论方法进行了ADMET相关的叁个工作:第二章用QSPR方法研究了60个类药化合物的固有水溶解度与其结构之间的关系。GA选了5个参数,分别用这五个参数建立了遗传算法-多元线性回归方法(GA-MLR)和最小二乘支持向量机(LS-SVM)模型。所得模型通过了各种验证方法,包括留一法(LOO)交叉验证、Y-随机验证以及外部测试集验证。GA-MLR模型得到训练集的RMSR为0.51,判定系数R~2为0.88,交叉验证系数O~2为0.84以及Y-随机R~2为0.07;测试集的结果R~2为0.82,RMSE为0.84。而LS-SVM模型的训练集的O~2为0.86,R~2为0.90,RMSE为0.47;测试集R~2为0.83,RMSE为0.49。可见GA-MLR和LS-SVM方法结果比较接近,这两个模型是稳健的,可用来准确预测化合物的固有水溶解度。第叁章里我们用GA-MLR方法预测了与血脑渗透性有密切相关的70个神经中枢系统(CNS)药物的微乳液毛细管电动色谱(MEEKC)的容量因子,并对分子结构和容量因子作了相关分析,从而间接预测药物的脑组织非结合率,为血脑屏障的预测提供了简化易行的研究思路。对模型进行测试集、留一法交互验证、Y-随机方法验证。该模型的训练集各项评价指标分别为:RMSE为0.25,相应的判定系数(R~2)为0.87、交叉验证(Q~2)为0.75和Y-随机R~2为0.10:测试集判定系数R~2为0.91,RMSE为0.23。可以看出,GA-MLR模型具有良好的预测能力。第四章讨论了理论预测223个类药化合物的橄榄油溶剂化自由能。用GA选出的5个变量分别建立了GA-MLR和LS-SVM模型。GA-MLR的Y-随机R~2为0.03。GA-MLR模型和LS-SVM模型训练集的O~2、R~2、RMSE、AARD、F值都很接近,分别是0.88 vs 0.87、0.89 vs 0.89、0.67 vs 0.67、20.08%vs 19.80%、271.86vs 275.60;而GA-MLR模型和LS-SVM模型测试集的R~2、RMSE、AARD、F也基本相似,即0.91 vs 0.92、0.73 vs 0.74、15.26%vs 14.62%、82.86 vs 84.92:也就是说GA-MLR模型和LS-SVM模型预测能力也比较相近,所以使用线性模型即可很好地预测橄榄油溶剂化自由能。第五章研究了1080个有机化合物抗磁磁化率的定量结构性质关系(QSPR)。使用GA选出最重要的叁个描述符来建立多元线性回归(GA-MLR)模型,然后通过留一法交互验证(LOO),Y-随机测试以及外部测试集验证了该模型具有较好的稳定性。GA-MLR模型的训练集各项评价指标分别为:AARD为4.51%,RMSE为5.63,相应的判定系数(R~2)为0.98,交叉验证(Q~2)为0.98和Y-随机R~2为-0.02;测试集的评价指标分别如下:判定系数R~2为0.98,RMSE为7.14以及AARD为5.24%。相比较而言,源文献训练集的R~2为0.98,RMSE为5.41以及AARD为5.07%,而其测试集R~2为0.98,RMSE为6.05及AARD为5.52%。而由于GA-MLR模型能给出较小的AARD值,故GA-MLR与源文献模型的预测准确度是相近的。(本文来源于《兰州大学》期刊2009-05-01)

计算机辅助性质预测论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

近些年来,组合化学和高通量筛选技术的不断发展产生了大量化学、生物和药物等方面的相关数据。但是,得到化合物小分子的结构以及生物大分子的序列和结构的速度远远大于得到其相对应的性质和功能数据的速度,这在一定程度上阻碍了研究者们对知识的探索。而计算机辅助方法则提供了一条可取的有效途径。本论文所关注的就是利用计算机辅助的方法对蛋白质大分子、药物小分子的性质进行预测研究,以及对配体-蛋白质相互作用模式和相关生理活性进行预测研究。一方面的目的是利用已知数据建立准确、快速的预测模型,以对未知样本的性质进行预测;另一方面的目的是通过对所建立的预测模型的解释,期望在一定程度上揭示影响性质的关键因素,能够为样本的优化提供有用的信息;最后,期望计算机辅助预测这种方法以及所建立的预测模型能够应用于实际中,有助于筛选出符合研究者要求的化合物分子,节约实验成本、提高筛选速度、缩短实验周期。论文的第一章概述了计算机辅助性质预测方法的基本原理,从数据的获取和处理、研究样本的特征表示、模型的建立、评价和验证这些方面进行了详细的阐述。另外,介绍了计算机辅助配体-蛋白结合模式预测—分子对接方法的原理。最后,对本论文所使用的算法进行了介绍。论文的第二章,我们将计算机辅助性质预测方法应用于蛋白质大分子的性质预测。具体研究内容是蛋白质折迭过程中最基本的两个方面:蛋白质折迭速率的定量预测和蛋白质折迭途径类型的模式识别研究。在第一个研究工作中,完全从蛋白质序列角度出发,采用氨基酸序列自相关方法对101条蛋白质序列进行了表征,基于遗传算法选择出来的关键特征,分别采用全局(multiple linear regression, MLR)和局部(local lazy regression, LLR)模型来预测蛋白质的折迭速率,结果显示局部模型的预测能力优于全局模型。而且,3-fold、5-fold和10-fold交互检验的结果也表明了局部模型具有很好的预测能力和稳定性。此外,我们还分析了影响蛋白质折迭速率的关键特征:未折迭的熵变、疏水作用、二级结构偏好以及残基柔性。在第二个研究工作中,同样地,完全从蛋白质序列角度出发,采用氨基酸序列自相关方法对101条蛋白质序列进行了表征,使用支持向量机-递归特征消除(Support Vector Machine-Recursive Feature Elimination, SVM-RFE)对所有计算得到的特征根据其支持向量的权重进行重要性排序,通过抽一法(leave-one-out, LOO)交互检验的结果,最小二乘支持向量机(least square-support vector machines,LS-SVMs)方法最终使用排在前7个的重要特征建立了分类模型,准确率为91.09%,Matthews相关系数为80.88%。3-fold、5-fold和10-fold交互检验的结果也显示了所建立的预测模型的预测能力和稳定性。另外,我们还分析了氨基酸性质对蛋白折迭途径类型的影响,比如未折迭的自由能、疏水性、二级结构分布以及电荷分布等。论文的第叁章,我们将计算机辅助法应用于配体-蛋白的相互作用模式和相互作用强度的预测。在第一个研究工作中,采用从蛋白、配体和蛋白-配体复合物角度出发的组合分子建模方法分析了58个分子对白明胶酶MMP-2和MMP-9的结构-活性关系和结合模式。(1)蛋白角度:蛋白分子的序列比对和结构迭合能够更好地了解蛋白的活性位点信息;(2)抑制剂小分子角度:QSAR研究可以准确预测小分子的抑制活性,并提供影响活性的关键结构特征的信息;(3)蛋白-配体复合物角度:分子对接研究能够识别关键残基以及更好地理解蛋白-配体的关键相互作用。这种从多角度出发的研究策略能够提供很多重要的信息,并且为将来设计新的MMPs抑制剂分子提供了一种思路。在第二个研究工作中,以一系列新型MMP-13抑制剂分子为研究对象,关注了QSAR研究中的两个重要问题:活性构象的选取和描述符的表征。在MMP-13受体结构已知的情况下,通过精确的分子对接程序Glide将所有待研究的化合物分子对接到MMP-13的活性位点处,获得化合物分子的活性构象。在描述符表征部分,使用了配体分子的结构描述符、ADME性质相关的描述符以及表征配体和蛋白相互作用的描述符,通过遗传算法选择出影响化合物分子抑制活性的关键描述符,同时建立了MLR模型(全局模型),内部检验和外部检验都证明了其具有稳定性和预测能力。考虑到局部模型的优势,我们还建立了LLR模型,与全局模型相比,局部模型能显着提高模型的预测能力。论文的第四章,我们将计算机辅助性质预测方法应用于类药分子ADME/Tox相关性质的预测研究中。在第一个研究工作中,选取CYP2C19作为研究对象,基于7750个结构多样性的化合物分子,采用随机森林(random forest, RF)方法建立了识别CYP2C19底物分子的分类模型。基于6200个训练集样本,RF选出了19个重要的描述符,并且建立了分类模型,然后对1550个外部测试集样本进行了预测,结果显示外部测试集的预测准确率可达93.42%,Matthews相关系数达到80.36%。所建立的RF模型运行速度快,且识别精确度高,可以在药物研发的早期阶段用于识别CYP2C19的底物分子,从理论水平上为设计药物分子的研究者提供有用的信息,减少通过代谢导致的药物-药物相互作用的发生概率,提高药物的有效性、安全性。在第二个研究工作中,基于947个结构多样性的化合物分子,采用SVM-RFE方法对计算得到的描述符根据其支持向量的权重进行了重要性排序,用LS-SVMs方法建立了识别是否能引起药物性肝损伤的化合物分子的分类模型。基于710个训练集样本,通过LOO交互检验的结果,LS-SVMs最终使用排在前15个的重要描述符建立了分类模型,准确率达到76.48%,对237个外部测试集样本的预测准确率可达到70.04%。所建立的分类模型可以应用于判断化合物分子是否能引起人类肝细胞毒性,尤其是对能引起肝毒性的化合物分子的判断非常准确,说明理论计算方法是一种非常有效的预测工具,可以应用到其他许多ADME/Tox相关性质的预测上,并且可以在新药研发的早期阶段为研究者提供有用的信息,可能在一定程度上提高药物的筛选速度。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

计算机辅助性质预测论文参考文献

[1].李贡宇,乔连生,陈茜,陈艳昆,刘思佳.基于计算机辅助水解技术的芝麻寡肽体内转运性质预测[J].北京中医药大学学报.2018

[2].席莉莉.计算机辅助药物和蛋白性质预测研究[D].兰州大学.2010

[3].陈昱学.计算机辅助药物ADME性质预测新方法研究[D].兰州大学.2009

标签:;  ;  ;  ;  

计算机辅助性质预测论文-李贡宇,乔连生,陈茜,陈艳昆,刘思佳
下载Doc文档

猜你喜欢