导读:本文包含了有监督模型论文开题报告文献综述及选题提纲参考文献,主要关键词:文本分类,主题模型,隐含Dirichlet分布,吉布斯采样
有监督模型论文文献综述
唐焕玲,窦全胜,于立萍,宋英杰,鲁明羽[1](2019)在《有监督主题模型的SLDA-TC文本分类新方法》一文中研究指出本文提出了一种有监督主题模型的SLDA-TC(Supervised LDA-Text Categorization)文本分类方法,引入主题-类别概率分布参数,识别主题-类别的语义信息;提出SLDA-TC-Gibbs主题采样新方法,对每个词的隐含主题采样,只从该词所在文档的同类其它文档中采样,并给出了理论推导;另外,其主题数只需略大于类别数.实验表明,对比LDA-TC(LDA-Text Categorization)和SVM算法,本方法能提高分类精度和时间性能.(本文来源于《电子学报》期刊2019年06期)
袁桂霞,周先春[2](2018)在《基于多媒体信息检索的有监督词袋模型》一文中研究指出词袋模型的复杂度高,且区分能力较弱,为解决这一问题,在经典词袋模型的基础上,提出一种有监督的词袋模型。在训练过程中对训练样本类别进行标记,在此基础上构建直方图总体能量目标函数,依据能量最小准则学习码本。通过文本检索和图像检索两组多媒体信息检索实验进行对比,对比结果表明,有监督词袋模型比经典词袋模型的检索精确度高、检索耗时少。(本文来源于《计算机工程与设计》期刊2018年09期)
韩晓猛[3](2017)在《基于有监督预训练NIN和深度ELM模型的图像识别算法研究》一文中研究指出近年来,基于机器学习的图像识别技术得到了广泛的应用,并在多个领域发挥着极其重要的作用。相对于其他数据来说,图像中包含的信息量巨大而冗余。众所周知,机器学习方法的性能很大程度上取决于数据特征的选择,因而构建一个好的图像识别系统往往需要拥有一个较好的特征提取器,将原始数据转换成合适的特征表示或特征向量,以帮助分类器正确地进行图像的识别。以往的图像识别方法大多采用人工提取特征的方式,其设计过程不仅困难,而且需要相当的工程技巧和问题领域的专业知识。深度学习是一种允许机器自动从原始数据中学习到特征表示的方法,通过组合那些能够将某层特征表示转换到更加抽象的高层特征表示的简单非线性模块,深度学习方法能够学习到多层特征表示。对于分类任务来说,高层的特征表示能够放大输入中具有判别信息的部分,同时忽略输入中不相关的因素,从而提高分类性能。将深度学习用于图像识别问题已经成为图像识别领域的研究热点,并且取得了非常好的效果。本文提出了MPNIN模型用于解决图像识别问题。NIN模型使用了一种称为mlpconv层的非线性卷积层代替传统CNN模型中的线性卷积层,能够增强模型的非线性拟合能力。MPNIN模型的的主要思想是基于mlpconv层的有监督预训练,与传统的逐层有监督预训练算法有相似之处,但与传统逐层有监督预训练相比,基于mlpconv层的有监督预训练可以避免前者所存在的由于非线性表达能力不足而导致的过于贪婪的问题。另外,MPNIN模型中的有监督预训练为各层提供的监督信息能够有效抑制深度模型中常见的梯度弥散问题。尽管MPNIN模型已经取得了比较优越的识别效果,但CNN本身是一种训练过程非常慢的算法。针对CNN训练时间过长的问题,本文提出了R2CELM和R2ELM-LRF模型,这两者将ELM和堆迭泛化理论结合起来构建深度模型。ELM算法的学习速度非常快,具有优越的泛化性能,并且可以有效的解决局部最小值和过拟合问题。特别是其中的R2ELM-LRF模型是一种将基于局部感受野的特征提取与ELM相结合的算法,具有识别图像中局部相关性结构的优势和ELM不需要反向传播调整权值的优点。实验表明,新提出的模型不仅具有较好的识别性能,同时其收敛速度较常用的其他深度学习算法有很大提高。(本文来源于《南京航空航天大学》期刊2017-03-01)
刘涛[4](2016)在《基于有监督分层狄里克雷过程的对象分割模型》一文中研究指出随着计算机视觉领域研究的深入,对象类图像分割(也称对象分割)逐渐成为近年来图像分析、计算机视觉领域研究的重要问题之一,并不断推动和促进互联网搜索、智能家电、智能交通和自动驾驶汽车等相关领域的技术和产业的发展。本论文主要依据贝叶斯理论并结合随机场模型,研究基于有监督的非参数化的对象分割模型及其算法。本论文的主要内容和创新点主要有以下几个方面,1.提出了一种新的基于分层狄里克雷过程的非参数化判别模型来解决对象分割问题考虑到分层狄里克雷过程(Hierarchical Dirichlet Process,HDP)模型和隐条件随机场模型各自的特点,本论文一方面采用隐条件随机场模型(Hidden Conditional Random Field,HCRF)模型描述图像底层特征与语义对象的映射关系,并通过隐变量定义复杂的势函数,以期在实现对样本聚类的同时引入观测数据在空间上的平滑性约束。另一方面,通过引入HDP作为先验分布构造一种非参的判别模型用于描述多组结构化数据(如不同的输入图片)。这样,通过采用共享隐变量的假设,本论文将生成性的HDP模型和判别性的HCRF模型结合起来,提出一种新的判别性的非参数化随机场模型,即HDP-HCRF模型。该模型除能够实现对单幅图片中多类对象的分割外,亦可用于解决多输入图片的对象分割问题。2.提出了一套用于解决含隐变量的有监督非参数化模型的最大条件似然估计及其推理算法考虑到常用的EM (Expectation Maximization,EM)算法和对比散度(Contrastive Divergence,CD)算法都不能很好的解决含隐变量的HDP-HCRF模型在训练中的最大条件似然估计问题,因此本论文借鉴蒙特卡罗 EM (Monte Carlo Expectation Maximization,MCEM)算法推导出条件蒙特卡罗EM (Conditional MCEM,CMCEM)算法,并给出了其在线形式。由于HDP-HCRF模型结构简洁,减少了各部分的耦合性,因此便于采用迭代更新的训练方式,从而提高了算法对不同类型的具体问题的适应能力。另一方面,由于存在非参数化的HDP模型,即隐变量的状态可以有无限多取值,而与其相关的模型参数也自然的被推广到无限维,因此为减少计算量本论文将利用随机场模型的伪似然和树结构表示分别对优化目标函数作近似展开;此外,本论文在后者的目标函数中又引入关于参数的L1正则项,以减少模型的过拟合问题。3.在HDP-HCRF模型中引入高阶项,并给出其BMRM解考虑到对象分割属多分类问题,而且一幅图通常包括一类(甚至几类)对象的多个实例,为进一步描述图中同一对象的不同实例间的相关性以增加平滑隐状态的取值在空间上的平滑性。本论文又通过隐变量在HDP-HCRF中引入更高阶势函数。为避免配分函数的计算,给出了类似max-margin的最大边缘后验解及其基于正则化风险最小的束方法(Bundle Methods for Regularized Risk Minimization,BMRM)算法的训练过程及其推理。在不同数据集的实验结果同样表明,我们提出的模型和算法可用于解决对象分割问题,且性能优于常用的基于超像素的对象分割算法。(本文来源于《北京邮电大学》期刊2016-01-04)
王耀侦[5](2016)在《基于有监督视觉词袋框架的叁维模型检索算法研究》一文中研究指出叁维模型作为声音、图像以及视频之外的第四种多媒体数据类型,目前已被广泛应用于叁维影视动画、机械设计以及地理信息系统等多个领域。计算机软硬件水平的大幅度提升,使得叁维模型的种类和数量大大增长。为了提升设计开发人员的工作效率,降低开发成本,各个领域出现了大量的叁维模型库,以实现资源的重复利用;此外,互联网的普及也进一步加快了数据的传播和共享。因此,研究如何从大量的叁维模型中准确地检索到所需要的数据,具有十分重要的理论意义和实际应用参考价值。本文针对叁维模型的形状属性,就基于视图的叁维检索算法展开研究,并提出了一种基于有监督视觉词袋框架的叁维模型检索算法。主要包括以下几个方面:首先,在对叁维模型进行多角度正交投影时,为了使投影得到的深度图最大程度地保留模型的空间形状信息,提出一种自适应视距投影的操作,即在确定视角方向上,将投影平面自适应地调整到模型的切平面处,使得投影得到的二维深度图像纹理更加丰富,区分性更加明显。其次,为了充分利用模型库中重要的类信息,提出一种基于有监督视觉词袋框架的叁维模型特征编码方法,采用有监督的类词典替代传统的通用词典,以更加完备地表达模型的典型局部特征,从而使后续编码得到的特征向量更准确地描述叁维模型的形状。最后,由于在实际应用中,用户往往更关心检索结果的前几页内容,而对排在后面的模型关注甚少,受此启发,本文提出一种检索结果修正策略,首先对初始检索结果中前几页模型的类标签进行统计分析,由此确定查询输入模型所属的类别,并以此为根据,实现对初始检索结果的修正,提升最终的检索准确率。实验在普林斯顿大学的基准模型库上进行,结合本文所提出的自适应视距投影和有监督的类词典进行叁维模型检索时,平均准确率达到74.1%,相对于现有基于单一视距的单位球面投影和传统通用词典的叁维检索算法提升了18.1%,表明本文算法能够更加准确、有效地描述和区分叁维模型的形状。此外,采用本文所提出的检索结果修正策略对初始查询结果进行修正后,检索精度大大提升,达到90.1%,验证了该操作的有效性。并且,由于该修正操作和前期叁维检索过程相互独立,因此可以将该策略直接推广到其他叁维模型检索算法中,以进一步提升各种检索方法的整体性能。(本文来源于《北京理工大学》期刊2016-01-01)
邹晓春,赵歆波,杨勇佳,李娜[6](2015)在《一种基于有监督学习的视觉注意力模型》一文中研究指出视觉注意力建模技术是计算机主动视觉领域的关键技术。为了提高传统视觉注意力模型预测人眼注视点的精度,提出了一种基于有监督学习的视觉注意力模型,该模型通过引入真实眼动数据作为监督值,结合自底向上特征(如方向、颜色、强度)及自顶向下特征(如人、脸、汽车等),作为Ada Boost分类器的样本,训练出自然场景中像素点特征向量与注视点之间的映射,并采用训练后的模型生成自然场景的视觉显着区域。实验结果表明,本文模型优于现有的8个主流模型,并能够较高质量地预测人类注视点。(本文来源于《中国体视学与图像分析》期刊2015年03期)
武丽丽[7](2015)在《基于有监督学习图像理解中的序模型研究》一文中研究指出随着机器学习的广泛应用,通过机器学习解决排序问题已引起很多学者关注。本文在国内外相关研究成果基础上,探讨了一些学习排序的新思路,并为交通拥挤度和人脸美丽度估计提供一种新方法。首先,针对交通场景中拥挤度估计问题,提出基于有监督序学习交通场景拥挤度排序计算模型,利用监督学习思路分别学习交通拥挤度和平均速度两个属性的排序函数。在交通拥挤度排序模型中,首先提取每帧训练图像GIST特征,而对于平均速度排序模型,首先通过帧间差分法提取视频运动信息,然后再提取GIST特征,最后引入改进的Ranking SVM投影模型,学习得到每个属性排序函数。其次,针对美丽指数自动评价问题,为此提出一种个性化人脸美丽指数相对排序模型。首先,根据大量志愿者对训练图像的主观评分进行初步排序,可以得到通用的排序模型,然后,在通用模型基础上结合用户审美进行重排序,就会得到根据用户审美的个性化排序模型。采用GIST与HOG的混合特征类型,与Eigenfaces和Dense-SIFT单个特征类型相比,获得较好的排序结果。再次,针对提取人脸图像的美丽度信息问题,本文提出一种散射卷积网络特征提取方法,该方法能提取图像在弹性形变和平移变化的不变特征,并且对光照不敏感。小波散射变换可以区分有相同傅里叶变换的能量谱。小波散射卷积网络分层次提取图像高频信息,本文将小波散射卷积网络输出的前叁层散射能量特征作为人脸美丽指数度量特征。为验证小波散射卷积网络特征提取方法用于人脸美丽指数评价系统的有效性,本文采用相对属性排序算法建立了一个人脸美丽指数排序模型。最后,本文对图像排序算法在解决交通拥挤度问题及美丽指数自动评价问题上进行了研究。在解决交通拥挤度问题上,提出一种有监督序拥挤度排序算法,在解决美丽指数评价问题上对此算法进行了改进,提出一种个性化人脸美丽指数排序模型,并将散射卷积网络用于提取人脸美丽度特征。(本文来源于《燕山大学》期刊2015-05-01)
丁宇新,燕泽权,冯威,薛成龙,周迪[8](2015)在《基于有监督主题模型的排序学习算法》一文中研究指出文档表示是排序学习的关键,目前的排序学习算法多采用词袋法表示文档与查询,该方法假设词袋中的词相互独立,忽略了词之间的关系.为了表示文档中词之间的依赖关系,本研究利用文档与查询的主题特征构建排序学习模型,我们将排序函数定义为文档与查询之间的主题关系,提出了基于有监督主题模型的排序学习算法自动学习排序函数.为了评价模型的排序精度,我们在叁个标准数据集(OHSUMED,MQ2007,MQ2008)上进行了实验.实验表明基于主题的排序学习算法能够发现文档与查询之间内在的语义关联,并改善排序模型的排序精度.(本文来源于《电子学报》期刊2015年02期)
蒋卓人,陈燕,高良才,汤帜,刘晓钟[9](2015)在《一种结合有监督学习的动态主题模型》一文中研究指出针对传统主题模型存在的不足,提出一种新的结合有监督学习的动态主题模型(Supervised Dynamic Topic Model,S-DTM)。该模型不仅能够随时间的变化对语言进行动态建模,而且结合有监督学习技术,在主题变分推理中加入标签约束,从而建立主题与标签之间的映射关系,提高主题的表达解释能力。通过在一个跨越25年"以自然语言处理领域的中文期刊论文为主导"的中文语料库上的实验,证明该模型相较于静态的有监督主题模型和无监督的动态主题模型,具有更好的语义解释概括能力,能更准确地反映文档的主题结构,更精确地捕捉主题–词汇概率分布的动态演化。(本文来源于《北京大学学报(自然科学版)》期刊2015年02期)
李晓旭,李睿凡,冯方向,曹洁,王小捷[10](2014)在《多视图有监督的LDA模型》一文中研究指出本文主要关注多视图数据的分类问题.考虑到集成分类方法可组合多个弱分类器构成一个强分类器,以及主题模型能学习复杂数据的语义表示,本文试图将集成学习思想引入主题模型中,以便同时学习多视图数据的分类规则和预测性语义特征.具体地,结合概率主题模型LDA模型和集成分类方法 Softmax混合模型,提出了一个多视图有监督的分类模型.基于变分EM方法,推导了该模型的参数估计算法.两个真实图像数据集上的实验结果表明了提出模型有较好的分类性能.(本文来源于《电子学报》期刊2014年10期)
有监督模型论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
词袋模型的复杂度高,且区分能力较弱,为解决这一问题,在经典词袋模型的基础上,提出一种有监督的词袋模型。在训练过程中对训练样本类别进行标记,在此基础上构建直方图总体能量目标函数,依据能量最小准则学习码本。通过文本检索和图像检索两组多媒体信息检索实验进行对比,对比结果表明,有监督词袋模型比经典词袋模型的检索精确度高、检索耗时少。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
有监督模型论文参考文献
[1].唐焕玲,窦全胜,于立萍,宋英杰,鲁明羽.有监督主题模型的SLDA-TC文本分类新方法[J].电子学报.2019
[2].袁桂霞,周先春.基于多媒体信息检索的有监督词袋模型[J].计算机工程与设计.2018
[3].韩晓猛.基于有监督预训练NIN和深度ELM模型的图像识别算法研究[D].南京航空航天大学.2017
[4].刘涛.基于有监督分层狄里克雷过程的对象分割模型[D].北京邮电大学.2016
[5].王耀侦.基于有监督视觉词袋框架的叁维模型检索算法研究[D].北京理工大学.2016
[6].邹晓春,赵歆波,杨勇佳,李娜.一种基于有监督学习的视觉注意力模型[J].中国体视学与图像分析.2015
[7].武丽丽.基于有监督学习图像理解中的序模型研究[D].燕山大学.2015
[8].丁宇新,燕泽权,冯威,薛成龙,周迪.基于有监督主题模型的排序学习算法[J].电子学报.2015
[9].蒋卓人,陈燕,高良才,汤帜,刘晓钟.一种结合有监督学习的动态主题模型[J].北京大学学报(自然科学版).2015
[10].李晓旭,李睿凡,冯方向,曹洁,王小捷.多视图有监督的LDA模型[J].电子学报.2014
标签:文本分类; 主题模型; 隐含Dirichlet分布; 吉布斯采样;