导读:本文包含了多示例多标记学习论文开题报告文献综述及选题提纲参考文献,主要关键词:层次性多示例多标记学习,树结构,G蛋白偶联受体,生物学功能
多示例多标记学习论文文献综述
袁京洲,高昊,周家特,冯巧遇,吴建盛[1](2019)在《基于树结构的层次性多示例多标记学习》一文中研究指出针对多示例多标记学习中标记间树结构的问题,将多示例学习、多标记学习和树结构标记优化方法有机融合,提出了基于树结构标记的层次性多示例多标记学习方法TreeMIML. TreeMIML先将样本中的多个示例转化为单示例,然后通过多标记学习得到新样本的标记,最后通过树结构标记优化方法学习样本的最终标记.实验结果证明,TreeMIML方法在G蛋白偶联受体的生物学功能预测上获得了很好的分类性能,优于目前最好的多示例多标记学习和多标记学习方法.(本文来源于《南京师大学报(自然科学版)》期刊2019年03期)
朱越,姜远,周志华[2](2018)在《一种基于多示例多标记学习的新标记学习方法》一文中研究指出多标记学习是一种应用非常广泛的学习范式,其中,一个对象可能同时与多个标记相关联.传统的多标记学习研究多假设训练数据中观察到的标记分布与测试数据的真实标记分布一致.但在实际应用中,训练数据中可能存在一些从未被标注出的新标记.在预测时,不仅希望能够在目标标记集合(已知标记)上取得好的性能,还要求能够检测出样本是否存在新标记.针对这种多标记新标记学习问题,本文提出了一种端到端的多视图多示例多标记学习方法 EM3NL.该方法基于卷积神经网络产生多示例包,并通过最小化包上观察标记的错分损失和对新标记预测值排序损失的惩罚以及对多视图预测不一致的惩罚同时学习图像,文本两个视图的特征表示以及已知标记和新标记的预测函数.在大规模图片–文本真实数据集上验证了EM3NL在已知标记学习和新标记检测任务上的有效性.(本文来源于《中国科学:信息科学》期刊2018年12期)
冯巧遇[3](2018)在《层次性多示例多标记学习算法的研究》一文中研究指出多示例多标记学习是机器学习中解决实际问题时常见的学习框架。在过去,学习对象由一个示例(即属性向量)描述且对应于一个类别标记,但是随着问题的复杂性和事物的多变性,一个样本可以由多个示例组成,同时该样本属于多个类别标记,这种问题的学习就是多示例多标记学习框架。随着科技的飞速发展,大数据时代日益逼近,深入研究多示例多标记学习算法具有很大的现实意义。现实很多多示例多标记学习应用中,标记之间是有关联的,并且很多应用场景下,标记呈现层次性树(TREE)结构或者有向无环图(DAG,Directed Acyclic Graph)结构。但是目前对多示例多标记研究时往往忽略了标记之间的层次依赖性,迫切需要开发一种可以考虑这种层次性标记关系的全新多示例多标记学习方法。所以本论文将提出两种基于层次性结构的多示例多标记学习算法,即基于树结构、有向无环图结构的多示例多标记学习算法。算法充分考虑了标记之间的层次性结构,提高了算法的效率,并扩大了多示例多标记学习的应用范围。本文把算法应用于G蛋白偶联受体的生物学功能预测,由于GO(Gene Ontology)标记通常可表示为两种层次性结构,即树和有向无环图结构,所以在该数据集上分别对提出的两种算法TreeMIML和DAGMIML进行实验仿真。实验证明,两种层次性多示例多标记学习算法具有较好的预测性能。(本文来源于《南京邮电大学》期刊2018-11-14)
吴建盛,冯巧遇,袁京洲,胡海峰,周家特[4](2018)在《基于快速多示例多标记学习的G蛋白偶联受体生物学功能预测》一文中研究指出G蛋白偶联受体(G protein-coupled receptors,GPCRs)是人类中最庞大的膜蛋白家族,也是很多药物的重要靶点,准确了解GPCRs生物学功能是理解它们参与的生物学过程及其药物作用机制的关键.以前的研究表明,蛋白质功能预测可抽象为多示例多标记学习(multi-instance multi-label learning,MIML)问题.设计了一种基于快速多示例多标记学习方法 MIMLfast的GPCRs生物学功能预测模型.该模型采用了一种新的混合特征,它考虑了GPCRs结构域的叁联氨基酸、氨基酸关联、进化、二级结构关联、信号肽及无序残基等多种信息.实验结果证明,该模型获得了很好的性能,优于目前最优的多示例多标记学习、多标记学习的预测方法和CAFA蛋白质功能预测方法.(本文来源于《计算机研究与发展》期刊2018年08期)
闵婕[5](2018)在《基于多示例多标记学习的图像分类》一文中研究指出随着当今社会互联网技术与信息技术的快速发展,以及图像多媒体等设备的普及,图像数据信息量日益剧增。因此,如何将这些图像进行有效而准确地分类管理成为了一个亟待解决的技术难题和研究热点。本文的主要工作如下:首先,针对传统的距离度量方法不能准确地度量包与包之间距离的问题,本文提出了自调节距离度量方法,该方法可根据不同的数据集特点自动调节距离,使得距离度量更加精准。并且提出了基于自调节距离度量的多示例多标记图像分类算法。其次,在不平衡样本集情况下,多示例多标记径向基函数神经网络产生隐层神经元数量不平衡,训练时忽略了样本较少的类,使得分类效果变差。针对该问题,本文提出了图像分类中径向基函数神经网络结构优化算法。该算法在第一阶段根据训练集分布情况优化各个类别上的神经元数量以及其中心和宽度,使得不平衡样本集中各个类别上的神经元处于平衡,降低不平衡样本对网络性能的影响。在Zhou等学者建立的自然场景图像数据集中,将本文提出的两种改进算法与经典图像分类算法分别进行对比,实验结果验证了本文算法的有效性与优越性。(本文来源于《武汉科技大学》期刊2018-05-19)
王一宾,程玉胜,裴根生[6](2018)在《结合均值漂移的多示例多标记学习改进算法》一文中研究指出多示例多标记学习在多语义对象处理中克服了多示例学习和多标记学习的缺点,成功应用于文本分类、图像识别标注、基因数据分析等任务中.其中基于退化策略的多示例多标记学习算法,多利用K-Medoids聚类将多示例多标记退化成单示例多标记,但此种退化方式过于简化多语义和复杂语义的对象,并未考虑示例间的相关性,导致退化过程中的信息削弱甚至丢失.针对这一问题,提出了结合均值漂移的多示例多标记学习改进算法(MultiInstance Multi-Label with Mean Shift,MIMLMS),将高斯核函数和权值加入均值漂移中.权值的加入保证了示例之间的相关性得以保留,而将多示例集合加入高斯核函数就可利用核密度估计和梯度下降法求解退化过程最优解,最终以误差平方和为分类目标函数,建立多示例多标记分类模型.算法在基准的多示例多标记测试数据集中的实验结果,验证了算法的良好分类效果及算法的有效性和可靠性.(本文来源于《南京大学学报(自然科学)》期刊2018年02期)
唐川[7](2017)在《距离度量学习在多示例多标记学习中的应用研究》一文中研究指出多示例多标记学习(MIMLL,Multi-Instance Multi-Label Learning)是机器学习的一个重要分支。MIML学习框架中,一个样本由多个示例即特征向量表示,并同时与多个标记相关联。因为自身的结构复杂和多语义特性,图像和文本的分类和近邻搜索问题可以归结为MIML学习问题。传统的MIML算法使用豪斯多夫距离(Hausdorff distance)来度量样本在特征空间的距离,无法反映出样本间的语义相关性。而距离度量学习通过利用样本的标记信息来优化样本间距离,达到距离度量的语义一致。本文在MIML学习架构下,通过距离度量学习优化样本的分类和搜索算法,主要贡献如下:提出了一种基于聚类策略的MIML距离度量学习算法,该算法在学习过程中引入了聚类思想与标记相关性,在简化了距离度量学习复杂度的同时探索了标记与示例之间的关系;设计了一种联合距离度量学习和k-最近邻技术的MIML分类算法,利用学习得到的距离度量计算样本近邻充分考虑了语义一致性,提高了分类算法的性能;设计了一种联合距离度量学习和锚图哈希(AGH,Anchor Graph Hashing)技术的MIML哈希算法,利用学习得到的距离度量构建样本与锚点的邻接矩阵,充分考虑语义一致性,提高了哈希算法性能;实验验证了本文提出的分类及哈希算法的有效性。(本文来源于《南京邮电大学》期刊2017-10-26)
严考碧[8](2016)在《基于特征学习的多示例多标记学习研究》一文中研究指出随着互联网和多媒体技术的迅速发展,每天都有海量的数据产生,其中就包含着海量的图像、文本等数据,如何有效地利用和管理这类图像、文本数据,日益成为科研和商业需要解决的一个问题。对于这些海量的图像、文本等数据,数据呈现出给我们的不再是简单的单一的内容形式,现实生活中呈现出的更多是具有复杂内容的多义性的样本数据,如何有效地处理这类多义性样本数据,是当前科研的一个难点。在处理具有复杂内容的多义性对象时,一种比较有效的处理方法是多示例多标记学习方法。在这种方法下,用多示例的方法来表示样本数据的复杂内容,用多标记的方法来表示样本数据的多个语义,通过提取示例的特征,对特征和标记之间建立模型,从而达到识别多语义样本数据的目的。然而,在建立算法模型时,提取什么样的特征,怎么来表示提取的特征,从根源上关系到多示例多标学习方法的识别效果。基于这一点,本文根据现有的底层特征提取方法、中层语义特征提取方法、特征学习如深度学习技术等,将这些技术融入到多示例多标记学习方法中,提出了一种通用的多示例多标记学习框架模型。本文的主要研究内容如下:(1)通过研究特征学习技术、多示例多标记学习技术等,挖掘算法中的不足,在现有理论方法的基础上,将特征学习技术融入到多示例多标记学习中,提出了一种通用的多示例多标记学习框架,该模型框架可以很好地改善现有多示例多标记学习方法中的不足。(2)在通用模型框架的基础上,提出了一种基于主题模型的多示例多标记学习方法(CPNMIML),在该方法中,算法的特征学习模型采用的是概率潜在语义分析模型(PLSA),该特征学习模型是一种浅层的特征学习模型,其特征学习的能力有限,因此,基于卷积神经网络的多示例多标记学习方法(CNNMIML)应用而生,卷积神经网络是深度学习的一种模型,具备良好的特征学习能力。在多示例多标记学习方法中,研究者已经提出了很多算法,而MIMLBOOST和MIMLSVN是两个比较典型的算法,因此,在进行实验结果对比时,本文将提出的方法和MIMLBOOST和MIMLSVN这两种方法分别进行了比较,在基准数据集上进行实验,结果表明,本文提出的方法在性能上都比MIMLBOOST和MIMLSVN好。(本文来源于《广西师范大学》期刊2016-04-01)
唐俊,周志华[9](2016)在《基于多示例多标记学习的手机游戏道具推荐》一文中研究指出手机游戏提供商通过在游戏中销售虚拟道具来获得收益。将游戏玩家日志数据中每个事件描述为一个示例,玩家对多种游戏道具的购买状态表示为多个标记,从而将游戏道具推荐问题抽象为多示例多标记学习问题。在此基础上,将快速多示例多标记学习算法用于手机网络游戏道具推荐,并利用半监督学习提升推荐性能。离线数据集以及实际在线手机网络游戏实验结果表明,基于多示例多标记学习的游戏道具推荐技术带来了游戏营收的显着增长。(本文来源于《计算机科学与探索》期刊2016年01期)
严考碧,李志欣,张灿龙[10](2015)在《基于主题模型的多示例多标记学习方法》一文中研究指出针对现有的大部分多示例多标记(MIML)算法都没有考虑如何更好地表示对象特征这一问题,将概率潜在语义分析(PLSA)模型和神经网络(NN)相结合,提出了基于主题模型的多示例多标记学习方法。算法通过概率潜在语义分析模型学习到所有训练样本的潜在主题分布,该过程是一个特征学习的过程,用于学习到更好的特征表达,用学习到的每个样本的潜在主题分布作为输入来训练神经网络。当给定一个测试样本时,学习测试样本的潜在主题分布,将学习到的潜在主题分布输入到训练好的神经网络中,从而得到测试样本的标记集合。与两种经典的基于分解策略的多示例多标记算法相比,实验结果表明提出的新方法在现实世界中的两种多示例多标记学习任务中具有更优越的性能。(本文来源于《计算机应用》期刊2015年08期)
多示例多标记学习论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
多标记学习是一种应用非常广泛的学习范式,其中,一个对象可能同时与多个标记相关联.传统的多标记学习研究多假设训练数据中观察到的标记分布与测试数据的真实标记分布一致.但在实际应用中,训练数据中可能存在一些从未被标注出的新标记.在预测时,不仅希望能够在目标标记集合(已知标记)上取得好的性能,还要求能够检测出样本是否存在新标记.针对这种多标记新标记学习问题,本文提出了一种端到端的多视图多示例多标记学习方法 EM3NL.该方法基于卷积神经网络产生多示例包,并通过最小化包上观察标记的错分损失和对新标记预测值排序损失的惩罚以及对多视图预测不一致的惩罚同时学习图像,文本两个视图的特征表示以及已知标记和新标记的预测函数.在大规模图片–文本真实数据集上验证了EM3NL在已知标记学习和新标记检测任务上的有效性.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
多示例多标记学习论文参考文献
[1].袁京洲,高昊,周家特,冯巧遇,吴建盛.基于树结构的层次性多示例多标记学习[J].南京师大学报(自然科学版).2019
[2].朱越,姜远,周志华.一种基于多示例多标记学习的新标记学习方法[J].中国科学:信息科学.2018
[3].冯巧遇.层次性多示例多标记学习算法的研究[D].南京邮电大学.2018
[4].吴建盛,冯巧遇,袁京洲,胡海峰,周家特.基于快速多示例多标记学习的G蛋白偶联受体生物学功能预测[J].计算机研究与发展.2018
[5].闵婕.基于多示例多标记学习的图像分类[D].武汉科技大学.2018
[6].王一宾,程玉胜,裴根生.结合均值漂移的多示例多标记学习改进算法[J].南京大学学报(自然科学).2018
[7].唐川.距离度量学习在多示例多标记学习中的应用研究[D].南京邮电大学.2017
[8].严考碧.基于特征学习的多示例多标记学习研究[D].广西师范大学.2016
[9].唐俊,周志华.基于多示例多标记学习的手机游戏道具推荐[J].计算机科学与探索.2016
[10].严考碧,李志欣,张灿龙.基于主题模型的多示例多标记学习方法[J].计算机应用.2015
标签:层次性多示例多标记学习; 树结构; G蛋白偶联受体; 生物学功能;