导读:本文包含了无监督识别论文开题报告文献综述及选题提纲参考文献,主要关键词:地球化学异常,异常识别,银铅锌矿床,浙西北
无监督识别论文文献综述
王俊,周永章,肖凡,余晓彤,耿厅[1](2019)在《基于无监督机器学习的地球化学异常识别——以浙西北银铅锌矿床为例》一文中研究指出地球化学异常识别是矿产勘查中的一项基础性工作。由于成矿作用是地质过程中的稀有事件(Cheng,2018; Xiong and Zuo, 2018),因此机器学习中的异常点检测算法,例如孤立森林(IsolationForest)、单分类支持向量机(OneClassSVM)、局部异常因子算法(Local OutlierFactor)、以及堆迭自编码机、深度受限玻尔兹曼机及其系列变种等,均可用于提取与成矿相关的地球化学异常模式。但地球化学异常模式往往隐藏在高维的地球化学数据中,异常模式的识别受到与成矿无关的冗余维度的干扰(Zuo et al., 2019)。上述无监(本文来源于《第九届全国成矿理论与找矿方法学术讨论会论文摘要集》期刊2019-12-13)
周丽丽,杜寅甫[2](2019)在《无监督条件下跨领域目标识别关键技术研究》一文中研究指出人工智能与机器识别技术的发展加快了社会的进步,传统机器学习的方法并不适用于所有的环境,这就要求目标识别算法能够在半监督或无监督情况下进行训练。本文提出基于结构化联合分布适配的无监督大样本跨领域目标识别算法模型。为实现无监督少样本条件下的跨领域目标识别提供新的思路与方法。(本文来源于《自动化技术与应用》期刊2019年11期)
来文豪,周孟然,李大同,王亚,胡锋[3](2019)在《无监督学习AE和MVO-DBSCAN结合LIF在煤矿突水识别中的应用》一文中研究指出快速准确的识别突水类型和突水来源对煤矿安全开采具有重要意义,激光诱导荧光(LIF)技术在检测中具有快速性和灵敏性,将LIF应用于煤矿突水的检测,再结合模式识别算法,可快速识别出突水来源。目前用于识别水样光谱的算法过于依赖预先建立的水样光谱数据库,当突水水源不在该库中时,易引发误识别。无监督学习算法DBSCAN在聚类时不需样本集的标签和类别信息,能降低对未知类别的误识别,因此把DBSCAN算法用于突水的激光诱导荧光光谱识别,并将MVO用于DBSCAN的参数寻优,省去繁琐的人工参数寻优过程。实验中,从谢桥煤矿采水点获取四个水样,利用像素为2 048的USB2000+光谱仪采集水样的荧光光谱,每种水样采集30组光谱数据。首先,利用无监督学习算法自动编码器(AE)对原始光谱数据降维,以减少光谱数据中冗余信息对聚类的影响,设计的AE的结构是介于浅层和深层之间的多层网络模型,可将原始光谱数据降到2维;为使降维模型具有稀疏性,在传统的AE算法中加入一个Dropout层,由实验可知,加入Dropout层后的降维模型具有较快的收敛速度。将多元宇宙优化(MVO)算法用于DBSCAN参数寻优,在参数寻优过程中, DBSCAN对降维后的水样光谱识别率最高为97.5%,此时参数所对应的取值范围为[0.023 66 0.040 65];为验证AE对水样光谱数据降维的有效性,把归一化后的未降维的光谱数据用于DBSCAN聚类识别, DBSCAN对原始水样光谱的识别率最高为95%,比降维后的后水样光谱识别率低了2.5%,结果表明,使用AE降维光谱数据,可提高DBSCAN对不同光谱的识别率。最后,用监督学习算法K最近邻(KNN)识别降维后的水样光谱,将识别结果和无监督学习算法DBSCAN的识别结果对比,其中训练集选用叁种水样,测试集使用四种水样;在测试集中,监督学习算法只能准确地识别训练集所包含的水样类别,但把训练集没有的类别全部识别错误,而DBSCAN能准确的识别出训练集中没有的水样光谱。非线性降维算法AE能实现对高维的水样光谱数据降维,把MVO-DBSCAN用于煤矿突水水源的LIF光谱识别,可有效降低因矿井水源光谱数据库建立不完备而引起的误识别。(本文来源于《光谱学与光谱分析》期刊2019年08期)
廖星宇[4](2019)在《基于无监督增量学习的跨域行人重识别》一文中研究指出行人重识别(Person Re-ID)是一个应用范围非常广的任务,目前很多方法已经在单域上实现了非常大的性能提升。然而,将一个模型适应到一个没有标签的新域上仍然非常困难。这是因为两个域采集数据的摄像头通常是不同的,最后会导致数据的分布也会出现差异,目前这是行人重识别推向实际应用的一个主要障碍。为了解决这个问题,很多研究者尝试了不同的办法,比如学习一个从源域到目标域的不变映射或者利用生成对抗网络创造属于目标域的“假”数据等等,但是都没有取得太好的效果。为了解决这个问题,我们从一个基本事实出发,即目标域上没有标签的数据非常容易获取,并且在实际中会以增量的方式获得。基于这个考虑,我们提出了一个新奇的无监督增量学习框架,充分利用目标域上没有标签的数据来连续地实时更新目标域上的重识别模型。首先,我们逐步地合并相似的样本成为同一个人,然后推远属于不同人的不相似的样本,同时拉近相同人的相似样本来优化模型;接着,通过一个新奇的知识蒸馏的方式,我们从在线收集的数据上增量地更新重识别模型;最后,重识别模型可以实现目标域上连续的学习过程从而来逐步地实现目标域的适应。也就是说,提出的增量学习策略可以不忘记以前学到的知识,同时也不需要增加模型参数量,实现一个新域的逐步学习和适应。实验结果证明,在跨域的设定下,通过两个大规模数据集Market-1501和DukeMTMC-reID上的实验,我们提出的方法在rank1准确率上分别以23.2%和13.8%超过目前先进的性能。(本文来源于《中国科学技术大学》期刊2019-06-02)
吴焕钦[5](2019)在《基于跨语言迁移的无监督命名实体识别研究》一文中研究指出命名实体作为自然语言文本的关键语义信息,其识别与分类是目前自然语言处理研究中的重要研究内容。随着深度学习技术在多数语言处理任务上的普遍应用,基于深度神经网络的命名实体识别模型已经取得了较好的性能。而深度神经网络模型的成功往往依赖于规模较大的标注数据。对于使用人数较多且语料资源丰富的语言而言,获取相应的手工标注数据可能相对容易。然而,对于大多数的低资源语言而言,其用于该任务的人工标注数据规模往往较小,甚至可能不存在,且在这些语言上进行人工标注也显得较为困难。针对低资源语言上缺少命名实体识别标注数据的现状,本文的研究主要围绕如何充分地利用资源丰富语言上的手工标注数据,通过跨语言迁移将其迁移到资源稀缺语言上,从而完成低资源语言上的命名实体识别任务。本文主要针对资源稀缺语言的命名实体识别任务中的无监督应用场景,即语言中不存在任何该任务的手工标注数据的情况。围绕该极端应用场景,本文的研究主要包含以下叁个方面。(1)研究跨语言投影的无监督命名实体识别方法。针对低资源语言不存在任何标注数据的情况,对于如何利用资源丰富语言上的标注数据,本文通过两种不同的跨语言投影标注方法将高资源语言上的人工标注数据迁移到低资源语言上。在该过程中,双语词对齐与跨语言词向量将被用于实现标注在双语之间的投影。此外,注意力机制将被加入到已有的端到端的命名实体识别框架中,以更好的建模得到待标注句子间词与词的依赖关系。(2)研究面向无监督命名实体识别的跨语言迁移方法。针对跨语言投影过程中得到的标注数据带有噪声的问题,本文提出面向无监督命名实体识别的跨语言迁移模型,以代替已有跨语言投影中的基于规则映射的方法。为了更好地将所提出的跨语言迁移模型应用于低资源语言的命名实体识别任务中,本文采用后验正则框架将跨语言迁移模型作为低资源语言命名实体识别模型的正则项,建立联合训练框架,并基于期望最大化算法迭代训练跨语言迁移模型与低资源命名实体识别模型。从而获得更准确的低资源命名实体识别模型。(3)研究基于双语数据的跨语言无监督命名实体识别方法。针对低资源语言上伪标注数据规模较小的情况,本文提出引入外部双语数据的低资源语言命名实体识别框架。在该框架中,为减少引入无监督双语数据后带来的噪声,本文提出基于词对齐的双语伪标注数据过滤方法。此外,本文还将过滤后的双语伪标注数据引入到联合训练框架中以进一步提升低资源语言的命名实体识别模型的性能。(本文来源于《哈尔滨工业大学》期刊2019-06-01)
谢澈澈[6](2019)在《基于深度学习和无监督域适应的跨用户行为识别研究》一文中研究指出人体行为识别是近年来备受关注的研究方向,可以广泛地应用于智能护理、智能家居和人机交互等领域。由于可穿戴传感器具有低成本、便携性和保护隐私的特点,已受到广泛的研究和应用。对于可穿戴传感器的行为识别,现有的模型通常存在普适性差的问题,因其所采用的训练集中的用户与目标用户通常存在行为差异,导致模型难以适用于不同用户。而针对目标用户收集大量标记数据去重新训练模型也不现实。针对行为识别的用户个性化问题,本文结合深度学习和无监督域适应方法,提出并实现了一个基于无监督深度域适应的跨用户行为识别模型CUAS,并在六个数据集上进行多个对比实验验证本文方法的有效性。本文的主要工作包括:(1)基于深度神经网络的特征提取方法。为了更有效地提取传感器数据的时序特征,本文提出一个基于属性时序卷积和分段LSTM的深度学习模型(ATC-SLSTM),将时序样本分成多个局部片段,采用LSTM提取片段之间的时间依赖关系。对于每个局部片段,本文提出基于属性时序卷积的特征提取方法,采用多层小卷积迭加来对每个属性提取多种粒度的时序特征,并提出一种属性特征缩放机制来实现各个数据属性的动态加权,以强调不同属性的重要程度。(2)基于特征分布对齐的无监督域适应方法。针对目标用户与训练数据集中的用户的行为差异问题,本文将两者的行为数据通过ATC-SLSTM映射到同一特征空间,而后同时进行边缘分布对齐和类条件分布对齐。为提高对齐效果,本文提出基于方差和均值差异的分布距离度量方法用于边缘分布对齐,在此基础上提出增加方差约束和类别权重的改进方法,以提高类条件分布的类内对齐效果并更关注易被错分的类别。(3)针对跨用户行为识别模型CUAS的自训练方法。由于目标用户伪标签是类条件分布对齐的关键,直接影响模型效果。在本文提出的自训练方法中,首先采用最小熵来选择当前最优模型进入下一轮训练;而后使用该模型来预测伪标签,提出基于蒙特卡罗随机失活的伪标签预测置信度评估方法,选取具有高质量伪标签的样本迭代训练模型,并同时考虑类别平衡问题。实验表明,与其他四个方法相比,采用自训练方法优化的CUAS模型取得最好的跨用户行为识别效果。(本文来源于《华南理工大学》期刊2019-04-15)
刘娜[7](2019)在《基于迁移学习的无监督跨库面部表情识别方法研究》一文中研究指出面部表情在人类情感表达和信息传递中起着至关重要的作用。如果计算机能够具有理解和表达情感的能力,根据人类的表情判断人类的需求、心情和爱好等信息,计算机将会更好的为人类服务。这在人机交互、安防、机器人制造、医疗、通信和汽车等领域均具有很强的理论意义和实用价值。随着人工智能技术的飞速发展,面部表情识别的研究已取得了一定的成果。但主要针对训练集和测试集样本源于同一个数据库,识别时通常假设样本具有相同的特征分布。在实际情况下,采集环境和设备等的不同,会导致样本分布不同。此时传统的面部表情识别方法训练的分类器将不再适用。论文针对测试集样本标签完全未知的无监督跨库面部表情识别进行了一系列研究。主要研究成果如下:(1)提出了一种关键帧提取的方法,利用各帧图像与模板帧直方图相似度对比,选择合适的阈值,进行关键帧提取,解决了一个镜头下过多冗余信息会造成算法空间复杂度过高的问题。对CK+、Oulu-CASIAVIS、Oulu-CASIANIR、eNTERFACE四个数据库进行关键帧提取,利用关键帧数据集进行面部表情识别实验。利用仿射变换进行数据库人脸分割,为后续面部表情特征提取及识别做准备。(2)提出了一种领域自适应子空间学习(Domain-Adaptive subspace learning,DoSL)模型。利用DoSL模型学习一个能够将源域和目标域信号变换到由源域样本和特征选择的共同子空间的映射矩阵。在共同的子空间中,通过增加限制项使源域和目标域的情感信号遵循相似的特征分布。最终,利用带标签的源域样本可以准确的预测目标域样本的情感状态。(3)提出了一种超宽回归网络(Super Wide Regression Network,SWiRN)模型。利用深度学习网络强大的非线性能力,将线性子空间模型DoSL转换到了非线性的神经网络模型进行表情的识别分类,模型利用两个全连接网络将样本特征升到超高维的空间,利用超宽网络回归参数替代子空间学习中投影矩阵,建立人脸表情特征和标签之间关系,将样本特征投影到标签空间,利用限制项来强制SWiRN模型输出的特征具有相同或相似的特征分布,最终,达到对目标域样本表情进行预测的目的。(4)提出了一种深度自适应回归网络(Deep AdaptiveRegression Network,DARN)模型。在超宽回归网络SWiRN的基础上,利用卷积神经网络实现无监督面部表情识别。该网络不需要进行手工特征的提取,输入为训练集和测试集图片,利用卷积层进行特征提取,在全连接层加入限制项来约束所提特征的相似性,实现了端到端的操作。充分利用了大数据的优势,克服了光照等变化影响,提高了面临真实场景鲁棒性。(本文来源于《天津理工大学》期刊2019-02-01)
王振浩,杜虹锦,李国庆,张明泽[8](2018)在《基于t-分布邻域嵌入的同调机群无监督识别》一文中研究指出当系统发生严重级联故障导致失稳时,快速搜索同调机群是进行解列控制平息振荡的前提。针对发电机严重受扰后功角信号的非平稳、非线性的特点,以及需要根据经验人为决断同调分群类数的问题,提出一种基于t-分布邻域嵌入的同调机群无监督识别新方法。采用广域量测环境下发电机功角信号作为源数据,引入t-分布邻域嵌入算法将发电机功角信号进行建模并映射到二维子空间中。通过二维坐标下映射点之间的聚集程度衡量受扰动后发电机运行特性的相似性。随后利用仿射传播算法对发电机组进行无监督聚类分群。研究表明所提方法原理简单,易于解决实际问题。基于实测数据进行计算分析,可避免模型参数对分群的影响。通过2014年湖南省网73台发电机系统仿真,并与传统分群方法对比结果,验证了所提方法的有效性和快速性。(本文来源于《电力系统保护与控制》期刊2018年22期)
万萌,冯新玲[9](2018)在《基于无监督特征选择和卷积神经网络的图像识别算法》一文中研究指出传统的图像识别算法需要采集大量的特征信息,造成数据的冗余进而带来维数灾难.针对这种情况,提出一种基于无监督特征学习和深度卷积神经网络相结合的图像识别算法.利用一种快速的无监督特征学习算法,对原始特征集合的内部进行建模从而发现高维数据中隐藏的低维结构,进而达到特征提取和维数约简的目的;而深度卷积神经网络可以提取输入数据的不同层次特征,将低层次特征高层化使之更加抽象,提高数据的代表性,增加图像识别的精确度.实验表明,本文算法在相同环境下可以降低数据的冗余性,提高算法的识别的有效性.(本文来源于《赤峰学院学报(自然科学版)》期刊2018年10期)
夏海蛟,谭毅华[10](2018)在《一种面向识别的无监督特征学习算法》一文中研究指出特征抽取是图像识别的关键环节,准确的特征表达能够产生更准确的分类效果。采用软阈值编码器和正交匹配追踪(OMP)算法正交化视觉词典的方法,以提高单级计算结构的识别率,并进一步构造两级计算结构,获取图像更准确的特征,以提高图像的识别率。实验表明,采用软阈值编码器和OMP算法能提高单级计算结构提取特征的能力,提高大样本数据集中图像的识别率。两级计算结构能够提高自选数据集中图像的识别率。采用OMP算法能提高VOC2012数据中图像的识别率。在自选数据集上,两级计算结构优于单级计算结构,与NIN结构相比表现出优势,与卷积神经网络CNN相当,说明两级计算结构在自选数据集上有很好的适应性。(本文来源于《计算机工程与科学》期刊2018年06期)
无监督识别论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
人工智能与机器识别技术的发展加快了社会的进步,传统机器学习的方法并不适用于所有的环境,这就要求目标识别算法能够在半监督或无监督情况下进行训练。本文提出基于结构化联合分布适配的无监督大样本跨领域目标识别算法模型。为实现无监督少样本条件下的跨领域目标识别提供新的思路与方法。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
无监督识别论文参考文献
[1].王俊,周永章,肖凡,余晓彤,耿厅.基于无监督机器学习的地球化学异常识别——以浙西北银铅锌矿床为例[C].第九届全国成矿理论与找矿方法学术讨论会论文摘要集.2019
[2].周丽丽,杜寅甫.无监督条件下跨领域目标识别关键技术研究[J].自动化技术与应用.2019
[3].来文豪,周孟然,李大同,王亚,胡锋.无监督学习AE和MVO-DBSCAN结合LIF在煤矿突水识别中的应用[J].光谱学与光谱分析.2019
[4].廖星宇.基于无监督增量学习的跨域行人重识别[D].中国科学技术大学.2019
[5].吴焕钦.基于跨语言迁移的无监督命名实体识别研究[D].哈尔滨工业大学.2019
[6].谢澈澈.基于深度学习和无监督域适应的跨用户行为识别研究[D].华南理工大学.2019
[7].刘娜.基于迁移学习的无监督跨库面部表情识别方法研究[D].天津理工大学.2019
[8].王振浩,杜虹锦,李国庆,张明泽.基于t-分布邻域嵌入的同调机群无监督识别[J].电力系统保护与控制.2018
[9].万萌,冯新玲.基于无监督特征选择和卷积神经网络的图像识别算法[J].赤峰学院学报(自然科学版).2018
[10].夏海蛟,谭毅华.一种面向识别的无监督特征学习算法[J].计算机工程与科学.2018