本文主要研究内容
作者赵乐(2019)在《基于生物学特征的蛋白质-DNA界面热点残基预测方法研究》一文中研究指出:蛋白质和DNA是组成生命体复杂结构和功能的重要生物大分子。在各种生命活动中,它们之间的相互作用,即蛋白质-DNA相互作用,都有着相当重要的作用。而在蛋白质-DNA相互作用中,少部分氨基酸残基贡献了绝大部分的结合自由能,这部分残基被称为热点残基。研究蛋白质-DNA复合物结合机制和稳定性的一个关键就是识别其相互作用界面上的热点残基问题。丙氨酸扫描作为一种分析蛋白质表面上的特定氨基酸残基功能的生物实验技术,已经广泛应用于鉴定蛋白质-DNA中残基的结合自由能。这种实验技术将蛋白质-DNA界面上的氨基酸残基突变成丙氨酸,然后通过计算自由能的变化来识别热点残基。但是通过生物实验方法鉴定界面热点残基代价昂贵、耗时耗力,因此有必要发展识别蛋白质-DNA相互作用界面热点残基的计算方法。已有的计算方法大多使用基于分子动力学模拟的方法计算蛋白质-DNA结合自由能,进而预测热点残基。这类方法在构建预测模型时容易受到部分蛋白质结构的限制,并且预测效率也较低。而基于机器学习的计算方法则可以有效地克服这些不足之处。本文的主要工作如下:1.提出了基于一般性生物学特征的蛋白质-DNA热点残基预测方法。我们合并dbAMEPNI和SAMPDI两部分数据并筛选得到了64个蛋白质-DNA复合物共214个蛋白质-DNA界面残基,其中150个作为训练集,64个作为测试集。我们按照序列、结构、网络和溶剂可及表面积四个类别一共提取了114维特征。在比较分析了四种不同的特征选择方法后,提取了 10个最优特征。接着分别使用支持向量机、朴素贝叶斯、K近邻算法和随机森林来构建模型。并根据比较结果,最终使用支持向量机在10个特征上构建了预测模型PrPDH(Prediction of Protein-DNA binding Hot spot)。在训练与测试数据集上的比较结果表明,PrPDH预测性能相比其他方法性能更好,在训练集上的F1和AUC分别是0.721和0.803,在测试集上的F1为0.706,AUC为0.764。PrPDH的在线预测网址为http://bioinfo.ahu.edu.cn:8080/PrPDH/。2.提出了基于不同状态邻居信息的蛋白质-DNA热点残基预测方法。从蛋白质-DNA结合机制出发,在已有的10个最优特征基础上,分析蛋白质-DNA界面残基在结合和非结合DNA状态下的氢键、溶剂可及表面积、深度和突出指数特征,计算残基在作为供体时结合DNA链上相邻核苷酸产生的氢键数目,同时引入界面邻居残基的信息,改进溶剂可及表面积和残基深度、突出指数特征的编码方式,从而体现该残基在两种状态下的特征变化村相对于邻居残基的变化强度。最终共得到41维特征。然后使用基于支持向量机的递归特征消除法(SVM-RFE)并根据特征之间的相关性去除冗余并选择8维特征,结合支持向量机构建PrPDH-V2模型。通过模型的性能比较表明,PrPDH-V2相比PrPDH和其他方法在性能上有着较大的提升,在训练集上的F1为0.787,AUC为0.871,在测试集上的F1和AUC分别是0.755和0.852。实验结果表明,这种改进的特征编码方式能够有效识别蛋白质-DNA相互作用界面上的热点残基。
Abstract
dan bai zhi he DNAshi zu cheng sheng ming ti fu za jie gou he gong neng de chong yao sheng wu da fen zi 。zai ge chong sheng ming huo dong zhong ,ta men zhi jian de xiang hu zuo yong ,ji dan bai zhi -DNAxiang hu zuo yong ,dou you zhao xiang dang chong yao de zuo yong 。er zai dan bai zhi -DNAxiang hu zuo yong zhong ,shao bu fen an ji suan can ji gong suo le jue da bu fen de jie ge zi you neng ,zhe bu fen can ji bei chen wei re dian can ji 。yan jiu dan bai zhi -DNAfu ge wu jie ge ji zhi he wen ding xing de yi ge guan jian jiu shi shi bie ji xiang hu zuo yong jie mian shang de re dian can ji wen ti 。bing an suan sao miao zuo wei yi chong fen xi dan bai zhi biao mian shang de te ding an ji suan can ji gong neng de sheng wu shi yan ji shu ,yi jing an fan ying yong yu jian ding dan bai zhi -DNAzhong can ji de jie ge zi you neng 。zhe chong shi yan ji shu jiang dan bai zhi -DNAjie mian shang de an ji suan can ji tu bian cheng bing an suan ,ran hou tong guo ji suan zi you neng de bian hua lai shi bie re dian can ji 。dan shi tong guo sheng wu shi yan fang fa jian ding jie mian re dian can ji dai jia ang gui 、hao shi hao li ,yin ci you bi yao fa zhan shi bie dan bai zhi -DNAxiang hu zuo yong jie mian re dian can ji de ji suan fang fa 。yi you de ji suan fang fa da duo shi yong ji yu fen zi dong li xue mo ni de fang fa ji suan dan bai zhi -DNAjie ge zi you neng ,jin er yu ce re dian can ji 。zhe lei fang fa zai gou jian yu ce mo xing shi rong yi shou dao bu fen dan bai zhi jie gou de xian zhi ,bing ju yu ce xiao lv ye jiao di 。er ji yu ji qi xue xi de ji suan fang fa ze ke yi you xiao de ke fu zhe xie bu zu zhi chu 。ben wen de zhu yao gong zuo ru xia :1.di chu le ji yu yi ban xing sheng wu xue te zheng de dan bai zhi -DNAre dian can ji yu ce fang fa 。wo men ge bing dbAMEPNIhe SAMPDIliang bu fen shu ju bing shai shua de dao le 64ge dan bai zhi -DNAfu ge wu gong 214ge dan bai zhi -DNAjie mian can ji ,ji zhong 150ge zuo wei xun lian ji ,64ge zuo wei ce shi ji 。wo men an zhao xu lie 、jie gou 、wang lao he rong ji ke ji biao mian ji si ge lei bie yi gong di qu le 114wei te zheng 。zai bi jiao fen xi le si chong bu tong de te zheng shua ze fang fa hou ,di qu le 10ge zui you te zheng 。jie zhao fen bie shi yong zhi chi xiang liang ji 、piao su bei xie si 、Kjin lin suan fa he sui ji sen lin lai gou jian mo xing 。bing gen ju bi jiao jie guo ,zui zhong shi yong zhi chi xiang liang ji zai 10ge te zheng shang gou jian le yu ce mo xing PrPDH(Prediction of Protein-DNA binding Hot spot)。zai xun lian yu ce shi shu ju ji shang de bi jiao jie guo biao ming ,PrPDHyu ce xing neng xiang bi ji ta fang fa xing neng geng hao ,zai xun lian ji shang de F1he AUCfen bie shi 0.721he 0.803,zai ce shi ji shang de F1wei 0.706,AUCwei 0.764。PrPDHde zai xian yu ce wang zhi wei http://bioinfo.ahu.edu.cn:8080/PrPDH/。2.di chu le ji yu bu tong zhuang tai lin ju xin xi de dan bai zhi -DNAre dian can ji yu ce fang fa 。cong dan bai zhi -DNAjie ge ji zhi chu fa ,zai yi you de 10ge zui you te zheng ji chu shang ,fen xi dan bai zhi -DNAjie mian can ji zai jie ge he fei jie ge DNAzhuang tai xia de qing jian 、rong ji ke ji biao mian ji 、shen du he tu chu zhi shu te zheng ,ji suan can ji zai zuo wei gong ti shi jie ge DNAlian shang xiang lin he gan suan chan sheng de qing jian shu mu ,tong shi yin ru jie mian lin ju can ji de xin xi ,gai jin rong ji ke ji biao mian ji he can ji shen du 、tu chu zhi shu te zheng de bian ma fang shi ,cong er ti xian gai can ji zai liang chong zhuang tai xia de te zheng bian hua cun xiang dui yu lin ju can ji de bian hua jiang du 。zui zhong gong de dao 41wei te zheng 。ran hou shi yong ji yu zhi chi xiang liang ji de di gui te zheng xiao chu fa (SVM-RFE)bing gen ju te zheng zhi jian de xiang guan xing qu chu rong yu bing shua ze 8wei te zheng ,jie ge zhi chi xiang liang ji gou jian PrPDH-V2mo xing 。tong guo mo xing de xing neng bi jiao biao ming ,PrPDH-V2xiang bi PrPDHhe ji ta fang fa zai xing neng shang you zhao jiao da de di sheng ,zai xun lian ji shang de F1wei 0.787,AUCwei 0.871,zai ce shi ji shang de F1he AUCfen bie shi 0.755he 0.852。shi yan jie guo biao ming ,zhe chong gai jin de te zheng bian ma fang shi neng gou you xiao shi bie dan bai zhi -DNAxiang hu zuo yong jie mian shang de re dian can ji 。
论文参考文献
论文详细介绍
论文作者分别是来自安徽大学的赵乐,发表于刊物安徽大学2019-07-03论文,是一篇关于支持向量机论文,蛋白质相互作用论文,热点残基论文,溶剂可及表面积论文,邻居残基论文,安徽大学2019-07-03论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自安徽大学2019-07-03论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。
标签:支持向量机论文; 蛋白质相互作用论文; 热点残基论文; 溶剂可及表面积论文; 邻居残基论文; 安徽大学2019-07-03论文;