多标记论文-蒋芸,肖潇,侯金泉,陈莉

多标记论文-蒋芸,肖潇,侯金泉,陈莉

导读:本文包含了多标记论文开题报告文献综述及选题提纲参考文献,主要关键词:多标记学习,正,负相关性,标记独有特征,k近邻

多标记论文文献综述

蒋芸,肖潇,侯金泉,陈莉[1](2019)在《基于局部正、负标记相关性的k近邻多标记分类新算法》一文中研究指出在多标记学习中,每个样本都由一个实例表示,并与多个类标记相关联。现有的多标记学习算法大多是在全局利用标记相关性,即假设所有的样本共享不同类别标记之间的正相关性。然而,在实际应用中,不同的样本共享不同的标记相关性,标记间不仅存在正相关性,而且存在相互排斥的现象,即负相关性。针对这一问题,提出了基于局部正、负成对标记相关性的k近邻多标记分类算法PNLC。首先,对多标记数据的特征向量进行预处理,分别为每类标记构造对该类标记最具有判别能力的属性特征;然后,在训练阶段,PNLC算法通过所有训练样本中各样本的每个k近邻的真实标记构建标记之间的正、负局部成对相关性矩阵;最后,在测试阶段,首先得到每个测试样例的k近邻及其对应的正、负成对标记关系,利用该标记关系计算最大后验概率对测试样例进行预测。实验结果表明,PNLC算法在yeast和image数据集上的分类准确率明显优于其他常用的多标记分类算法。(本文来源于《计算机工程与科学》期刊2019年10期)

袁京洲,高昊,周家特,冯巧遇,吴建盛[2](2019)在《基于树结构的层次性多示例多标记学习》一文中研究指出针对多示例多标记学习中标记间树结构的问题,将多示例学习、多标记学习和树结构标记优化方法有机融合,提出了基于树结构标记的层次性多示例多标记学习方法TreeMIML. TreeMIML先将样本中的多个示例转化为单示例,然后通过多标记学习得到新样本的标记,最后通过树结构标记优化方法学习样本的最终标记.实验结果证明,TreeMIML方法在G蛋白偶联受体的生物学功能预测上获得了很好的分类性能,优于目前最好的多示例多标记学习和多标记学习方法.(本文来源于《南京师大学报(自然科学版)》期刊2019年03期)

辛基梁,张佳,李绍滋,李灿东[3](2019)在《中医健康状态辨识中的多标记分类方法研究》一文中研究指出目的:探索中医健康状态辨识中的多标记分类方法。方法:采用多标记分类算法LIFT、ML-kNN、RankSVM和单标记分类算法SVM、kNN对临床1 146例数据进行机器学习和测试。结果:平均精度从高到低依次为LIFT[(84.90±1.28)%]、ML-kNN[(68.95±2.61)%]、RankSVM[(67.10±6.11)%]、SVM[(65.47±1.33)%]、kNN[(34.08±2.28)%];LIFT、RankSVM比SVM性能更优,ML-kNN比kNN性能更优。结论:多标记分类算法的性能优于单标记分类算法,证明了多标记分类算法有助于解决中医健康状态辨识问题,且几种多标记分类算法中LIFT算法性能最优。(本文来源于《中华中医药杂志》期刊2019年09期)

张佳欢,李磊军,李美争,米据生,解滨[4](2019)在《基于变精度邻域粗糙集的多标记子空间研究》一文中研究指出多标记学习是目前机器学习中的热点研究问题。本文基于变精度邻域粗糙集探究多标记学习中的特征选择方法,并对所得到的多标记子空间进行了详细的分析。首先提出了基于多标记学习的变精度邻域粗糙集模型,进而给出了一种多标记学习中的特征选择方法。在此基础上,基于不同的精度和邻域能够得到不同的特征选择结果,即不同的特征子空间。该文详细分析了精度和邻域对特征子空间的影响,并将所得到的特征子空间进行集成,详细分析了相应的集成效果。(本文来源于《南京理工大学学报》期刊2019年04期)

姚二亮,李德玉,李艳红,白鹤翔,张超[5](2019)在《基于双空间模糊辨识关系的多标记特征选择》一文中研究指出已有的基于模糊粗糙集的多标记特征选择算法多从单一的样本空间刻画属性区分能力,忽视属性对标记的区分能力.基于这一认识,文中同时从样本和标记两个空间出发,提出基于双空间模糊辨识关系的多标记特征选择算法.首先,基于模糊辨识关系分别从样本和标记角度定义两种多标记属性重要性度量,然后通过权重融合的方式融合两种度量,基于融合后的度量,运用前向贪心算法构建多标记特征选择算法.在5个数据集上的对比实验验证本文算法的有效性.(本文来源于《模式识别与人工智能》期刊2019年08期)

梁美社,米据生,侯成军,靳晨霞[6](2019)在《基于局部广义多粒度粗糙集的多标记最优粒度选择》一文中研究指出在多粒度粗糙集模型中,粒度选择总是与正域有关.由于全体标记确定对象集上的分类过细,落入正域的对象很少或为空集,导致正域约简方法可能丢失大量信息甚至失效.为了克服这一缺陷,文中提出基于局部广义多粒度粗糙集的多标记最优粒度选择方法.首先,引入广义局部多粒度粗糙集的相关概念,通过设置信息水平参数,对单个标记的对象集合进行近似.然后,通过定义多粒度多标记信息系统的粒度质量,给出粒度重要性.最后,设计最优粒度选择的启发式算法,并通过实例验证文中方法的有效性.(本文来源于《模式识别与人工智能》期刊2019年08期)

吴能光,王华珍,许晓泓,刘俊龙,何霆[7](2019)在《MLICP-CNN:基于CNN与ICP的多标记胸片置信诊断模型》一文中研究指出针对胸片的多标记预测集缺少可校准性的缺陷,提出一种基于卷积神经网络(Convolutional Neural Networks,CNN)与归纳一致性预测器(Inductive Conformal Prediction,ICP)的多标记胸片置信诊断模型MLICP-CNN。该模型将学习数据划分为训练集和校准集,通过使用CNN从训练集中学习出规则D。基于规则D和校准集使用算法随机性对被测数据进行置信预测,即为每个被测数据提供附带置信度的多标记预测集。在对Chest X-ray14胸片数据集的实验结果表明,该模型在临床常用的95%置信度下,模型准确率为95%,体现了置信度评估的恰好可校准性。在CNN架构为Resenet50并采用LS-MLICP为奇异值映射函数下,模型性能最好,其确定预测率为96.43%,理想预测率为92.31%。另外,CNN架构对预测效率的影响程度远远小于奇异值映射函数。(本文来源于《计算机应用与软件》期刊2019年07期)

李村合,田程程,董玉坤[8](2019)在《基于分类器链的多示例多标记算法》一文中研究指出退化方法是求解多示例多标记学习(MIML)问题常用的求解方式,但是在退化过程中会造成标记之间的关联信息丢失。对该问题进行研究,提出OCC-MIMLSVM+分类算法,将MIMLSVM+算法与有序分类器链(OCC)方法相结合,通过对分类器进行合理组织,将标记之间的关联信息融入至算法的训练过程中,解决信息丢失问题,提高分类准确率。实验结果表明,改进算法取得了比基准多示例多标记算法更好的分类效果。(本文来源于《计算机工程与设计》期刊2019年06期)

侯涛文[9](2019)在《基于LDA的多标记源文本分类研究》一文中研究指出互联网技术的发展加快了大数据时代的到来,快速获取和分析大数据是当代互联网应用不可缺少的能力。而文本是数据信息的主要载体。传统监督机器学习算法需要大量专家标记数据才能训练高性能模型,而获得专家标记往往费时费力。众包系统利用群众智慧对数据进行标记,能以较低的成本对任务快速响应,因此得到了广泛的使用。但由于群众知识背景和工作能力各不相同,导致收集到的多标记存在噪声,不能直接代表正确标记。多标记源分类器是一种整合多标记的方法。文章将以提升多标记源分类器准确度和节约标记成本为目的,对多标记源分类器进行研究。将进行的主要工作有叁个方面:(1)提出了朴素贝叶斯深度加权算法用于数据分类。朴素贝叶斯(Naive Bayes)因其强独立性和特征同重要性假设,在对非均衡类样本分类时,容易将属于少数类的样本分到多数类。考虑到各个样本在分类中的不同重要程度,利用感受性曲线面积值对特征加权,实现提升算法的目的。实验结果表明,朴素贝叶斯加权算法有利于提高分类器在偏态样本中的分类准确率。(2)利用LDA((Latent Dirichlet Allocation))特征融合方法用于文本建模。多标记源在标记过程中往往受到文本主题的影响,通过融合主题模型特征和word2vec词向量特征构建文本特征,再代入高斯过程多标记源分类器进行训练,得到性能更高的模型,最终根据新文本特征推理出更准确的标记估计值。实验表明,特征融合方法能够进一步提升高斯过程多标记源分类器性能;(3)利用主动学习与多标记源分类器结合算法实现众包标记文本分类。主动学习同众包系统都具有减少成本的功能。主动学习首先利用少量标记样本初始化模型参数,然后利用适当规则挑选更有价值的样本交给人工标记,并不断迭代,直到满足终止条件。众包系统则可以为挑选样本提供人工标记渠道。同时根据主动学习思想制定合适规则,挑选出最适合标记该样本的标记源,达到成本最小化。实验证明,主动学习选取样本进行标记后训练模型,较随机抽取样本标记后训练模型,能实现更高准确度。叁种算法存在如下关系:第一个算法将作为对照组加入到后续算法的对比实验中,第叁个算法是在第二个算法上的提升,期望在保证分类器精度的条件下进一步降低文本标注的成本。(本文来源于《北京建筑大学》期刊2019-06-01)

唐莉[10](2019)在《基于样本差异性分析的多标记特征选择算法研究》一文中研究指出大数据时代,基于数据挖掘技术的医疗诊断对现在医学的医疗辅助中有着重要的作用。医疗诊断对于患者的病例、特征、患病类别以及严重性能够快速的进行判断,且对于实时性以及准确性具有较高的要求。目前,大数据分析领域中特征排序和选择算法已经应用到了很多领域,本文主要针对数据所呈现特征空间高维性、标记空间多标记性等特点,提出了对于多标记数据集中判断样本所属类别具有重要作用的特征。因此,通过深入分析已有数据的固有特点,基于粒计算思维,从样本粒化和特征粒化角度出发寻求对不同类别样本具有差异性的特征。在此基础上,利用已选特征进行分类建模,以提高数据的准确性和泛化能力。本文以信息粒化为基础,分别从样本粒化和特征粒化进行以下几个方面的研究:(1)因多标记数据往往呈现高维小样本特点,使得分类建模中易出现过拟合问题。本文根据聚类技术对数据集中的特征进行粒化,然后结合大间隔的相关知识,提出了一种基于样本差异性的多标记特征选择算法。实验结果表明该模型能有效地提高分类精度,且降低特征选择过程中的计算整体代价。(2)为了能够很好地度量特征间的相关性以及特征与标记间的相似性,以利于选出质量较高的特征,本文提出了多标记学习环境下邻域差异因子概念,邻域差异因子不仅能够用来衡量特征子集的区分能力,而且能有效地区分样本之间的差异性。从特征子集的紧凑性,分类精度,以及分类精度对着特征数目的变化等叁个方面验证了所提算法的有效性。(本文来源于《闽南师范大学》期刊2019-06-01)

多标记论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对多示例多标记学习中标记间树结构的问题,将多示例学习、多标记学习和树结构标记优化方法有机融合,提出了基于树结构标记的层次性多示例多标记学习方法TreeMIML. TreeMIML先将样本中的多个示例转化为单示例,然后通过多标记学习得到新样本的标记,最后通过树结构标记优化方法学习样本的最终标记.实验结果证明,TreeMIML方法在G蛋白偶联受体的生物学功能预测上获得了很好的分类性能,优于目前最好的多示例多标记学习和多标记学习方法.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

多标记论文参考文献

[1].蒋芸,肖潇,侯金泉,陈莉.基于局部正、负标记相关性的k近邻多标记分类新算法[J].计算机工程与科学.2019

[2].袁京洲,高昊,周家特,冯巧遇,吴建盛.基于树结构的层次性多示例多标记学习[J].南京师大学报(自然科学版).2019

[3].辛基梁,张佳,李绍滋,李灿东.中医健康状态辨识中的多标记分类方法研究[J].中华中医药杂志.2019

[4].张佳欢,李磊军,李美争,米据生,解滨.基于变精度邻域粗糙集的多标记子空间研究[J].南京理工大学学报.2019

[5].姚二亮,李德玉,李艳红,白鹤翔,张超.基于双空间模糊辨识关系的多标记特征选择[J].模式识别与人工智能.2019

[6].梁美社,米据生,侯成军,靳晨霞.基于局部广义多粒度粗糙集的多标记最优粒度选择[J].模式识别与人工智能.2019

[7].吴能光,王华珍,许晓泓,刘俊龙,何霆.MLICP-CNN:基于CNN与ICP的多标记胸片置信诊断模型[J].计算机应用与软件.2019

[8].李村合,田程程,董玉坤.基于分类器链的多示例多标记算法[J].计算机工程与设计.2019

[9].侯涛文.基于LDA的多标记源文本分类研究[D].北京建筑大学.2019

[10].唐莉.基于样本差异性分析的多标记特征选择算法研究[D].闽南师范大学.2019

标签:;  ;  ;  ;  ;  

多标记论文-蒋芸,肖潇,侯金泉,陈莉
下载Doc文档

猜你喜欢