张朝:基于多标签分类算法的植物蛋白功能预测研究论文

张朝:基于多标签分类算法的植物蛋白功能预测研究论文

本文主要研究内容

作者张朝(2019)在《基于多标签分类算法的植物蛋白功能预测研究》一文中研究指出:大数据时代,热点研究是挖掘有价值信息。本文研究目的是从大量未知蛋白质中挖掘其功能。事实证明蛋白功能具有多样性,因此本文使用能够同时处理多个功能类的多标签分类算法。本文未知植物蛋白来源内蒙古大学生科院,以GO功能为切入对未知蛋白进行挖掘,为得已知蛋白数据集,从GO数据库和uniprot数据库爬取包含43个GO功能类共计66341条蛋白质序列。本文深入研究了基于问题转换的BR、CC、RAKEL算法和基于算法转换的BR-KNN、ML-KNN、BPMLL算法。研究了基于理化性质、基于n-gram、基于k-skip-n-gram的特征提取方法,并使用特征融合,实验证明将n-gram和理化性质特征融合后在平均精度比只使用n-gram提升了0.008。改进理化性质特征提取方法使生成的特征数据集符合多标签分类的要求。本文将六种特征处理方法和六种多标签分类算法两两组合以快速有效的解决多标签分类问题,最后将数据集在36种组合上分别进行交叉实验,实验表明188维MLKNN在海明损失、0-1错误率、覆盖率、排序损失、平均精度上最优,分别比次优组合算法好0.003、0.0215、0.2383、0.0043、0.0176,在训练时间上仅次于用时最少的20维MLKNN2.9分钟,将188维特征提取方法和MLKNN结合形成新的算法,并将整合的算法打包为MultiLabel.jar,应用于地梢瓜未知蛋白得4423个蛋白功能预测结果,其中功能有:DNA结合转录因子活性,RNA聚合酶Ⅱ特异性,内切酶活性等。

Abstract

da shu ju shi dai ,re dian yan jiu shi wa jue you jia zhi xin xi 。ben wen yan jiu mu de shi cong da liang wei zhi dan bai zhi zhong wa jue ji gong neng 。shi shi zheng ming dan bai gong neng ju you duo yang xing ,yin ci ben wen shi yong neng gou tong shi chu li duo ge gong neng lei de duo biao qian fen lei suan fa 。ben wen wei zhi zhi wu dan bai lai yuan nei meng gu da xue sheng ke yuan ,yi GOgong neng wei qie ru dui wei zhi dan bai jin hang wa jue ,wei de yi zhi dan bai shu ju ji ,cong GOshu ju ku he uniprotshu ju ku pa qu bao han 43ge GOgong neng lei gong ji 66341tiao dan bai zhi xu lie 。ben wen shen ru yan jiu le ji yu wen ti zhuai huan de BR、CC、RAKELsuan fa he ji yu suan fa zhuai huan de BR-KNN、ML-KNN、BPMLLsuan fa 。yan jiu le ji yu li hua xing zhi 、ji yu n-gram、ji yu k-skip-n-gramde te zheng di qu fang fa ,bing shi yong te zheng rong ge ,shi yan zheng ming jiang n-gramhe li hua xing zhi te zheng rong ge hou zai ping jun jing du bi zhi shi yong n-gramdi sheng le 0.008。gai jin li hua xing zhi te zheng di qu fang fa shi sheng cheng de te zheng shu ju ji fu ge duo biao qian fen lei de yao qiu 。ben wen jiang liu chong te zheng chu li fang fa he liu chong duo biao qian fen lei suan fa liang liang zu ge yi kuai su you xiao de jie jue duo biao qian fen lei wen ti ,zui hou jiang shu ju ji zai 36chong zu ge shang fen bie jin hang jiao cha shi yan ,shi yan biao ming 188wei MLKNNzai hai ming sun shi 、0-1cuo wu lv 、fu gai lv 、pai xu sun shi 、ping jun jing du shang zui you ,fen bie bi ci you zu ge suan fa hao 0.003、0.0215、0.2383、0.0043、0.0176,zai xun lian shi jian shang jin ci yu yong shi zui shao de 20wei MLKNN2.9fen zhong ,jiang 188wei te zheng di qu fang fa he MLKNNjie ge xing cheng xin de suan fa ,bing jiang zheng ge de suan fa da bao wei MultiLabel.jar,ying yong yu de sao gua wei zhi dan bai de 4423ge dan bai gong neng yu ce jie guo ,ji zhong gong neng you :DNAjie ge zhuai lu yin zi huo xing ,RNAju ge mei Ⅱte yi xing ,nei qie mei huo xing deng 。

论文参考文献

  • [1].基于生物行为特征及单分类算法的手机用户持续认证研究[D]. 邹斌.西南大学2019
  • [2].基于注意力机制的方面级别情感分类算法研究[D]. 张海滨.电子科技大学2019
  • [3].面向短文本的情感分类算法研究[D]. 乔洁.山西大学2019
  • [4].基于机器学习的中文文本分类算法的研究与实现[D]. 朱梦.北京邮电大学2019
  • [5].微博情感分类算法研究[D]. 马莹.长春工业大学2019
  • [6].关联分类算法及其在医疗数据中的应用研究[D]. 郭叔瑾.兰州交通大学2018
  • [7].基于规则聚集特征的高速包分类算法[D]. 郑少毅.湖南大学2016
  • [8].基于局部插值嵌入的流形分类算法研究及应用[D]. 敬田禹.扬州大学2018
  • [9].基于结构的图分类算法研究[D]. 邵文晔.南京信息工程大学2018
  • [10].关联分类算法研究及其在冠心病诊断中的应用[D]. 秦晨普.浙江理工大学2019
  • 读者推荐
  • [1].高校信息系统中的数据挖掘与学生行为预警分析研究[D]. 陈艳红.湖北民族大学2019
  • [2].基于决策树算法的成绩预测模型研究及应用[D]. 吴蓓.西安理工大学2019
  • [3].基于智能算法的TA蛋白靶向预测方法研究[D]. 何演林.山东师范大学2019
  • [4].基于校园数据的教学行为分析研究[D]. 许道萌.山东师范大学2019
  • [5].多标签文本分类算法的研究与应用[D]. 冀先朋.山东大学2019
  • [6].基于大数据的农产品价格预测模型研究与实现[D]. 宋振虎.新疆大学2019
  • [7].高职生心理数据挖掘系统的应用与研究[D]. 赵晓艳.电子科技大学2009
  • [8].基于数据挖掘与移动通信技术的高速公路违法分析研究[D]. 李晶.浙江工业大学2009
  • [9].支持向量机在水质评价及预测中的应用研究[D]. 梁坚.浙江工业大学2009
  • [10].数据挖掘在大学生心理问题中的应用研究[D]. 任丽君.华东师范大学2006
  • 论文详细介绍

    论文作者分别是来自内蒙古大学的张朝,发表于刊物内蒙古大学2019-08-13论文,是一篇关于数据挖掘论文,蛋白质功能预测论文,多标签分类算法论文,特征提取论文,内蒙古大学2019-08-13论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自内蒙古大学2019-08-13论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。

    标签:;  ;  ;  ;  ;  

    张朝:基于多标签分类算法的植物蛋白功能预测研究论文
    下载Doc文档

    猜你喜欢