导读:本文包含了大间隔论文开题报告文献综述及选题提纲参考文献,主要关键词:故障诊断,支持向量机,稀疏编码,半监督最大间隔字典学习
大间隔论文文献综述
王维刚,陶京,刘占生[1](2019)在《基于半监督最大间隔字典学习的故障诊断方法》一文中研究指出针对有标记故障样本不足及传统半监督诊断方法识别率低的问题,提出基于半监督最大间隔字典学习算法(semi-supervised max-margin dictionary learning,简称SSMMDL)的故障诊断方法。该方法将无标记样本重构误差项添加至最大间隔字典学习算法模型中,通过最小化无标记样本稀疏重构误差项、有标记样本稀疏重构误差项、支持向量机的损失函数正则项和分类间隔正则项,实现字典和支持向量机的同步学习,从而获得判别能力较强的字典。在此基础上,运用稀疏编码获得测试样本的稀疏表示,利用基于稀疏表示的分类器进行故障识别。通过对转子不同故障进行识别,结果表明所提方法较相关对比算法识别准确率更高,可以满足机械故障在线监测的需要。(本文来源于《振动.测试与诊断》期刊2019年05期)
张仕将[2](2019)在《基于最大间隔和半监督学习的偏标记学习算法研究》一文中研究指出在机器学习中,偏标记学习是一种重要的弱监督学习框架。在该学习框架中,训练示例不再具有单一明确的标记,每个训练示例的真实标记被淹没在候选标记集中,并且真实标记在学习过程中不可获知。偏标记学习问题最棘手的地方在于示例的真实标记被淹没在非真实标记之中,并且非真实标记会对学习过程产生一定的干扰。解决该问题有两种思路:采用消歧的方法和采用非消歧的方法,其中采用消歧的方法又可以分为平均消歧和辨识消歧。采用消歧思想的偏标记学习方法是从每个训练示例的候选标记集中找出对应的真实标记。其中平均消歧的思想是将示例的每个候选标记都赋予相同的权重,通过学习模型在每个候选标记上的输出来达到消歧的目的;辨识消歧的思想是将示例的真实标记视为一个隐变量,通过不断迭代更新的方式来优化目标函数,进而达到消歧的目的。采用非消歧思想的偏标记学习方法是将训练示例的候选标记集作为一个整体进行处理,利用纠错输出码来解决偏标记学习中的多分类问题。本文分别从辨识消歧和非消歧两个角度对偏标记学习展开研究,主要的工作内容如下:第一,采用辨识消歧的思想,结合最大间隔准则,本文提出了一种偏标记学习算法PL-MM。该算法弥补了PL-SVM算法的不足,将示例的候选标记之间的差异作为模型训练的一部分。PL-MM算法不仅对示例的候选标记在模型中的最大输出与示例的非候选标记在模型中的最大输出之间的间隔进行优化,而且对示例的候选标记在模型中的最大输出与示例的候选标记在模型中的其他输出之间的间隔进行优化,来达到偏标记学习的目的。对于优化问题,PL-MM算法采用了改进的次梯度Pegasos算法求解,通过不断迭代更新的方式优化模型参数,完成了模型的学习。第二,采用非消歧的思想,结合半监督学习,本文提出了一种偏标记学习算法PL-S2ECOC。该算法通过构造无冗余的编码矩阵,将偏标记学习中的多分类学习任务拆分成一系列二分类学习任务进行求解。在编码阶段,首先PL-S2ECOC算法构造了一个无冗余的编码矩阵,使得编码矩阵中不存在相同或者互补的列编码,保证训练得到的二分类器互不相同。然后PL-S2ECOC算法采用半监督学习器作为二分类学习器,使得每一个二分类器的学习都能充分利用整个偏标记训练集。最后通过训练好的半监督学习器来预测测试示例在二分类问题中的类别标记。在解码阶段,PL-S2ECOC算法先用二分类学习任务中没有监督信息的示例来构建加权矩阵,再通过加权损失解码的策略对测试示例生成的码字进行解码,损失最小的类别标记为测试示例的预测标记。实验表明,与多个偏标记学习算法相比,PL-SVM算法和PL-S2ECOC算法在人工改造的UCI数据集和真实的偏标记数据集中都表现出了良好的性能。(本文来源于《太原理工大学》期刊2019-05-01)
胡胜元,陈盛双,谢良[3](2019)在《基于带偏倚最大间隔二值矩阵分解的多值矩阵分层填充》一文中研究指出最大间隔矩阵分解是解决矩阵填充的重要方法,它通过将每个项目投影到低维特征空间,构建出每个用户的超平面,对每个项目进行分类来完成矩阵填充.然而传统的最大间隔矩阵分解方法对二值矩阵进行分解时都假设所构造的超平面经过原点.为了使超平面具有普适性,提高分类效果,将超平面移动一定的偏倚量,提出了带偏倚的最大间隔二值矩阵分解方法.对于多值矩阵的填充问题,通过多次采用上述改进的二值矩阵分解方法,对多值矩阵进行分层填充,并采用交替优化的方法进行求解.在真实数据集Movielens上的实验结果优于目前已有的方法,并且在较低维的特征空间中就能够完成矩阵分解,能有效提高矩阵分解速度,减少计算内存.(本文来源于《小型微型计算机系统》期刊2019年03期)
杨洋,王正群,徐春林,严陈,鞠玲[4](2019)在《基于最大间隔准则的鲁棒多流形判别局部图嵌入算法》一文中研究指出针对现有的多流形人脸识别算法大多直接使用带有噪声的原始数据进行处理,而带有噪声的数据往往会对算法的准确率产生负面影响的问题,提出了一种基于最大间距准则的鲁棒多流形判别局部图嵌入算法(RMMDLGE/MMC)。首先,通过引入一个降噪投影对原始数据进行迭代降噪处理,提取出更加纯净的数据;其次,对数据图像进行分块,建立多流形模型;再次,结合最大间隔准则的思想,寻求最优的投影矩阵使得不同流形上的样本距离尽可能大,同时相同流形上的样本距离尽可能小;最后,计算待识样本流形到训练样本流形的距离进行分类识别。实验结果表明,与表现较好的最大间距准则框架下的多流形局部图嵌入算法(MLGE/MMC)相比,所提算法在添加噪声的ORL、Yale和FERET库上的分类识别率分别提高了1.04、1.28和2.13个百分点,分类效果明显提高。(本文来源于《计算机应用》期刊2019年05期)
吴青,齐韶维,孙凯悦,臧博研,赵祥[5](2018)在《最小二乘大间隔孪生支持向量机》一文中研究指出针对最小二乘孪生支持向量机(LSTWSVM)精度较低和可能存在的"奇异性"问题,提出了一种最小二乘大间隔孪生支持向量机(LSLMTSVM).该算法在最小二乘孪生支持向量机的优化目标函数中引入了间隔分布,提高了算法的泛化性能.在目标函数中加入正则项,实现了结构风险最小化,进一步提高了分类能力.实验结果表明,最小二乘大间隔孪生支持向量机比已有的相关算法性能更优.(本文来源于《北京邮电大学学报》期刊2018年06期)
寇振宇,杨绪兵,张福全,杨红鑫,许等平[6](2018)在《L1范数最大间隔分类器设计》一文中研究指出以L1范数为例,设计了一个L1范数的大间隔分类器L1MMC(L1-norm Maximum Margin Classifier),主要特点如下:(1)间隔由L1范数的点到平面距离解析表示;(2)该分类器与SVM一样,通过最大化L1间隔,达到同时最小化经验风险和结构风险的目的;(3)只需要通过线性规划进行求解,避免了SVM的二次规划问题;(4)分类精度达到甚至超过SVM.最后,在人工数据和国际标准UCI数据集上,验证了该方法的有效性.(本文来源于《南京师大学报(自然科学版)》期刊2018年04期)
张仕将,柴晶[7](2018)在《一种基于最大间隔的偏标记学习算法》一文中研究指出在机器学习中,偏标记学习是一类重要的弱监督学习框架;在该框架中训练示例不再具有单一明确的标记,每个训练示例的真实标记被隐藏在一个候选标记集中并且在学习过程中不可获知。为了解决从训练示例的候选标记集中学习真实标记的问题,基于最大间隔准则提出了一种新的偏标记学习算法;该算法是通过优化模型在候选标记集中最大输出与非候选标记集中最大输出之间的间隔,以及优化模型在候选标记集中最大输出与候选标记集中其他输出之间的间隔进行偏标记学习。采用改进的次梯度Pegasos算法完成模型参数的优化学习。在四组人工改造的UCI数据集中,在平均65%的情况下优于其他对比算法。在四组真实偏标记数据集中,相比其他对比算法,取得了4.4%~10.2%的性能提升。实验证明,具有更好的泛化性能。(本文来源于《科学技术与工程》期刊2018年28期)
曹雅茜,黄海燕[8](2019)在《基于代价敏感大间隔分布机的不平衡数据分类算法》一文中研究指出大间隔分布学习机(LDM)在应用于不平衡据分类时,由于忽略类别不均衡,会使少数类样本的识别率较低。针对这一不足,结合代价敏感思想提出了一种不平衡代价敏感大间隔分布算法(ICS-LDM)。首先,在计算间隔均值和间隔方差时,结合数据集的不平衡因子和样本错分代价参数,调整不同类别的间隔分布权重;其次,将可以快速收敛的循环对偶坐标下降法应用于求解目标函数;最后,通过逐渐提高少数类的间隔分布,可以实现间隔分布在各类别平衡且总体最大。在虚拟数据集和UCI公开数据集上的实验结果表明,ICS-LDM可以有效提高少数类的分类精度,平衡各类的分类性能。(本文来源于《华东理工大学学报(自然科学版)》期刊2019年04期)
许洁[9](2018)在《基于大间隔最近邻的度量学习算法研究》一文中研究指出随着全球化、网络化、信息化的深入,海量复杂的结构化数据不断地被收集和储存,智能数据分析作为技术进步的必要组成部分变得尤为重要,而机器学习因其在数据处理中的关键作用,受到了越来越多的关注。度量学习是机器学习的一个基础问题,许多主流的机器学习方法如K-均值聚类、最近邻分类、支持向量机等,性能很大程度上都依赖于所选择度量能否合理反映数据间的重要关系。手动选取的度量函数如欧氏距离虽然具有简单性和普遍性的优势,但其很难适应模式分类中的大部分问题。度量学习技术,通过利用数据监督信息,自动学习面向任务的距离函数,近年来成为一个热门的研究方向。虽然现有的度量学习方法在很多应用上取得了较好的结果,但它们不能很好地处理复杂的真实数据。针对度量学习面临的挑战性问题,本文从正则化先验的设计、度量矩阵的刻画、马氏距离的构造、模型的优化等方面,对基于大间隔最近邻的度量学习方法进行了深入研究,主要研究成果如下:(1)提出了一种基于复合结构的大间隔最近邻度量学习算法。该方法认为度量矩阵M不符合精确的低秩假设,并使用稀疏和低秩复合模型来刻画。与传统稀疏方法使用l_1范数正则不同,该方法要求稀疏部分的所有像素值都小于一个预先定义的阈值,这样损失函数会平等对待大于该阈值的所有像素值,使得模型更稳定。同时,与传统低秩方法最小化度量矩阵所有奇异值的和不同,该方法只要求低秩部分的奇异值小于另一个自适应学习得到的阈值,这样模型将会过滤掉对应较小奇异值的无关信息,使模型更鲁棒。即使在实际情况中,M的最优稀疏度和秩难以确定,该方法仍然稳定且可用。(2)提出了一种基于最大相关熵准则的大间隔最近邻度量学习算法,来处理真实数据中存在的恶意遮挡或退化问题。与传统方法不同,该方法将度量学习模型看作回归问题,并要求每个样本的类内重建残差大幅度小于类间重建残差。由于度量矩阵M是半正定的,所以可以被分解为M=L L,则重建残差可以看作是实施了线性变换L,之后使用相关熵诱导度量矩阵来刻画投影后的重建模型。该方法不仅能处理真实数据的遮挡问题,而且继承了传统度量学习方法的优势,即对图像对齐有效。(3)针对传统度量学习方法通常学习单一的马氏距离度量矩阵,无法刻画复杂的异质数据,且描述这些数据的特征大多也没有严格对齐的问题,提出了一种基于平滑Wasserstein距离的多层次大间隔最近邻度量学习算法。利用平滑Wasserstein距离刻画两个样本间的误差,而马氏距离则被当做Wasserstein距离中的地面距离。由于平滑Wasserstein距离不仅继承了距离本身的特性,而且引入了描述概率分布最优转移的流网络,因此无论两个样本是否对齐,它都能有效的度量样本间的相似性。另外,为了充分利用数据的结构信息,该方法通过一个共享的度量矩阵学习一个全局的平滑Wasserstein距离,用以模拟不同数据类之间的共性,通过额外的一些辅助度量矩阵学习多个局部的平滑Wasserstein距离,用以模拟每个数据类的特质。最后,该方法被应用于行为检测、亲属关系验证和视频分类叁个应用,取得了很好的结果。(4)提出一个双层距离度量学习模型,联合优化特征提取和度量学习任务。现有度量学习方法大多直接将预处理阶段从数据中提取的特征作为输入,而这些特征通常并没有考虑数据的局部几何结构和数据中可能存在的噪声,因此它们可能对于接下来的度量学习任务并不是最好的选择。双层距离度量学习模型中低层模型用于挖掘数据的潜在结构,高层模型直接迫使同类的样本更近、不同类的样本更远。值得注意的是,高层模型输入的数据样本由低层模型学到的稀疏系数来表示。受低层模型特征提取操作的影响,新的特征因为稀疏项变得对噪声更鲁棒,因为拉普拉斯图项将变得更具有判别性。综上所述,本文以信号处理、模式识别为理论基础,以统计学习为主要技术手段,提出四种新的度量学习模型,有效改善了现有方法存在的不足,在人脸验证和模式分类方面取得了较好的效果,为解决度量学习问题提供了新的途径。(本文来源于《西安电子科技大学》期刊2018-08-01)
徐晓玲,金忠,贲圣兰[10](2018)在《基于标签敏感最大间隔准则的人脸年龄两步估计算法》一文中研究指出传统的最大间隔准则在计算类间离散度矩阵时往往忽略了类别之间的差异,但是对于人脸年龄估计,不同年龄标签之间的差异性是非常显着的。因此,在标签之间引入距离度量,提出标签敏感的最大间隔准则维数约减算法。此外,考虑到人脸变老的复杂性,提出两步的局部回归算法——K近邻-标签分布的支持向量回归(K Nearset Neighbors-Label Distribution Support Vector Reressor,KNN-LDSVR),以进行人脸年龄估计。在FGNET数据库子集上提出的人脸年龄估计方法的平均绝对误差为4.1岁,相对于已有的年龄估计方法,性能得到提升。(本文来源于《计算机科学》期刊2018年06期)
大间隔论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在机器学习中,偏标记学习是一种重要的弱监督学习框架。在该学习框架中,训练示例不再具有单一明确的标记,每个训练示例的真实标记被淹没在候选标记集中,并且真实标记在学习过程中不可获知。偏标记学习问题最棘手的地方在于示例的真实标记被淹没在非真实标记之中,并且非真实标记会对学习过程产生一定的干扰。解决该问题有两种思路:采用消歧的方法和采用非消歧的方法,其中采用消歧的方法又可以分为平均消歧和辨识消歧。采用消歧思想的偏标记学习方法是从每个训练示例的候选标记集中找出对应的真实标记。其中平均消歧的思想是将示例的每个候选标记都赋予相同的权重,通过学习模型在每个候选标记上的输出来达到消歧的目的;辨识消歧的思想是将示例的真实标记视为一个隐变量,通过不断迭代更新的方式来优化目标函数,进而达到消歧的目的。采用非消歧思想的偏标记学习方法是将训练示例的候选标记集作为一个整体进行处理,利用纠错输出码来解决偏标记学习中的多分类问题。本文分别从辨识消歧和非消歧两个角度对偏标记学习展开研究,主要的工作内容如下:第一,采用辨识消歧的思想,结合最大间隔准则,本文提出了一种偏标记学习算法PL-MM。该算法弥补了PL-SVM算法的不足,将示例的候选标记之间的差异作为模型训练的一部分。PL-MM算法不仅对示例的候选标记在模型中的最大输出与示例的非候选标记在模型中的最大输出之间的间隔进行优化,而且对示例的候选标记在模型中的最大输出与示例的候选标记在模型中的其他输出之间的间隔进行优化,来达到偏标记学习的目的。对于优化问题,PL-MM算法采用了改进的次梯度Pegasos算法求解,通过不断迭代更新的方式优化模型参数,完成了模型的学习。第二,采用非消歧的思想,结合半监督学习,本文提出了一种偏标记学习算法PL-S2ECOC。该算法通过构造无冗余的编码矩阵,将偏标记学习中的多分类学习任务拆分成一系列二分类学习任务进行求解。在编码阶段,首先PL-S2ECOC算法构造了一个无冗余的编码矩阵,使得编码矩阵中不存在相同或者互补的列编码,保证训练得到的二分类器互不相同。然后PL-S2ECOC算法采用半监督学习器作为二分类学习器,使得每一个二分类器的学习都能充分利用整个偏标记训练集。最后通过训练好的半监督学习器来预测测试示例在二分类问题中的类别标记。在解码阶段,PL-S2ECOC算法先用二分类学习任务中没有监督信息的示例来构建加权矩阵,再通过加权损失解码的策略对测试示例生成的码字进行解码,损失最小的类别标记为测试示例的预测标记。实验表明,与多个偏标记学习算法相比,PL-SVM算法和PL-S2ECOC算法在人工改造的UCI数据集和真实的偏标记数据集中都表现出了良好的性能。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
大间隔论文参考文献
[1].王维刚,陶京,刘占生.基于半监督最大间隔字典学习的故障诊断方法[J].振动.测试与诊断.2019
[2].张仕将.基于最大间隔和半监督学习的偏标记学习算法研究[D].太原理工大学.2019
[3].胡胜元,陈盛双,谢良.基于带偏倚最大间隔二值矩阵分解的多值矩阵分层填充[J].小型微型计算机系统.2019
[4].杨洋,王正群,徐春林,严陈,鞠玲.基于最大间隔准则的鲁棒多流形判别局部图嵌入算法[J].计算机应用.2019
[5].吴青,齐韶维,孙凯悦,臧博研,赵祥.最小二乘大间隔孪生支持向量机[J].北京邮电大学学报.2018
[6].寇振宇,杨绪兵,张福全,杨红鑫,许等平.L1范数最大间隔分类器设计[J].南京师大学报(自然科学版).2018
[7].张仕将,柴晶.一种基于最大间隔的偏标记学习算法[J].科学技术与工程.2018
[8].曹雅茜,黄海燕.基于代价敏感大间隔分布机的不平衡数据分类算法[J].华东理工大学学报(自然科学版).2019
[9].许洁.基于大间隔最近邻的度量学习算法研究[D].西安电子科技大学.2018
[10].徐晓玲,金忠,贲圣兰.基于标签敏感最大间隔准则的人脸年龄两步估计算法[J].计算机科学.2018
标签:故障诊断; 支持向量机; 稀疏编码; 半监督最大间隔字典学习;