基于分类的潜在语义模型论文-吕海峰,蔡明

基于分类的潜在语义模型论文-吕海峰,蔡明

导读:本文包含了基于分类的潜在语义模型论文开题报告文献综述及选题提纲参考文献,主要关键词:图像自动标注,词袋,支持向量机,概率潜语义分析

基于分类的潜在语义模型论文文献综述

吕海峰,蔡明[1](2018)在《基于概率潜在语义分析模型的分类融合图像标注》一文中研究指出图像自动标注作为计算机视觉领域重要的研究课题,近年来取得了巨大的成果,但由于语义鸿沟的存在,仍然存在巨大的挑战。本文提出一种基于概率潜在语义分析模型的分类融合图像标注方法。首先,该方法分别提取图像的形状和视觉特征,聚类生成词袋;然后利用融合概率潜在语义分析模型计算得出图像标注词的概率,并利用支持向量机依据图像颜色特征分类得到分类标签的类别权重;最后在得到的标注词概率中融入类别权重,最终得到图像的标签。并且使用Corel图像数据集进行标注模型的训练和图像的标注。实验结果表明,对比几种前沿的标注方法,本文获得了良好的性能。(本文来源于《电子技术与软件工程》期刊2018年07期)

辛欣,陈曙东,仝明磊,胡文皓,刘陈伟[2](2016)在《采用潜在概率语义模型和K近邻分类器的音频分类算法》一文中研究指出提出一种基于潜在概率语义(PLSA)模型和K近邻分类器的音频分类算法.首先,将信号特征向量送入潜在概率语义模型中训练,获得声音主题词袋模型;然后,使用K近邻分类器(KNN)进行分类.实验结果表明:与传统的K近邻分类算法相比,提出的算法在分类效果上有较明显的改善.(本文来源于《华侨大学学报(自然科学版)》期刊2016年02期)

陶超,谭毅华,彭碧发,田金文[3](2011)在《一种基于概率潜在语义模型的高分辨率遥感影像分类方法》一文中研究指出针对高分辨率遥感影像中"同谱异物","同物异谱"现象对影像分类过程造成的干扰,将文本分析中的概率潜在语义模型应用于高分辨率遥感影像分类,提出一种无监督的遥感影像分类新方法。该方法首先利用均值漂移分割方法对影像进行分割构建图像区域集合,然后提取集合各区域中每个像元的Gabor纹理特征,并对这些特征进行聚类形成视觉词汇,最后利用PLSA方法对各区域进行分析,找出其最可能属于的主题或者类别,从而完成影像分类。文中GeoEye-1和IKONOS影像试验结果表明,该方法能有效提高高分辨率遥感影像分类精度。(本文来源于《测绘学报》期刊2011年02期)

苏麒匀[4](2011)在《基于概率的潜在语义分析模型在搜索引擎商业文本分类系统中的应用研究》一文中研究指出就搜索引擎的盈利性来说,搜索引擎投放的商业广告是否与用户的搜索意图相关十分重要。传统的文本分类方法在搜索引擎的商业文本分类系统中解决了一部分问题,但是,语义的抽象性、多义性、同义性等特征是普遍存在的现象,如何定义和计算语义、怎样与上下文结合分析语义,仍然是搜索引擎目前面临的主要问题。本文针对搜索引擎的商业需求,利用近年来学术界提出的“潜在概率语义分析”(Probability Latent Semantic Analysis, PLSA)技术,以软件工程的思想为指导,设计并实现了搜索引擎商业文本分类系统中的潜在概率语义计算模块。最后,按照商业搜索引擎的业务要求,本文作者采用相关标准对本模块进行了测试,证明了它的有效性和实用性。(本文来源于《北京交通大学》期刊2011-01-01)

戎怡[5](2010)在《局部描述特征结合概率潜在语义模型的场景分类技术研究》一文中研究指出场景图像分类研究是对包含若干语义信息的图像集合进行分类的过程,可以对海量图像进行有效浏览与检索,成为当今计算机视觉研究领域的一个核心问题。鉴于图像与文本的关联性,将文本的词包模型与潜在语义分析模型运用到场景图像描述与分类上,具有重要的研究意义。针对当前图像特征提取算法有效性与复杂性相互制约的问题,展开以下研究:首先,构建了基于灰度图像局部边缘稠密采样区域的边缘改进局部二值模式(Edge Improved Local Binary Pattern,EILBP)特征,算法简单,性能稳定,能够对边缘信息丰富的图像进行合理描述,结合概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)模型完成场景分类,实验结果表明该特征提取算法应用在场景图像分类是有效的。然后,在EILBP特征的基础上,根据对称性构建了图像局部区域的边缘改进中心对称二值模式(Edge Improved Center Symmetric Local Binary Pattern,EICS-LBP)特征;针对彩色图像的颜色信息,构建了统计边缘主色对特征描述局部区域的边缘主色对信息;然后结合扩展PLSA模型完成场景分类,实验结果表明该方法具有较好的分类性能,对具有边缘轮廓的彩色图像分类精度高。最后,针对传统的视觉单词没有考虑特征间的依赖关系,不能充分表达图像主题这一问题,在彩色图像的EICS-LBP与统计边缘主色对特征的基础上,构造了一种含有上下文信息的视觉特征,之后结合扩展的PLSA模型实现场景分类。实验结果表明该方法具有较好的分类性能,对上下文信息丰富,具有边缘轮廓的彩色图像分类性能较好。(本文来源于《燕山大学》期刊2010-10-01)

张玉峰,何超[6](2010)在《基于潜在语义分析和HS-SVM的文本分类模型研究》一文中研究指出为了提高文本分类的准确性和效率,提出了一种基于潜在语义分析和超球支持向量机的文本分类模型。针对SVM对大规模文本分类时收敛速度较慢这一缺点,本文将超球支持向量机应用于文本分类,采用基于增量学习的超球支持向量机分类学习算法进行训练和分类。实验结果表明,超球支持向量机是一种解决SVM问题的有效方法,在文本分类应用中具有与SVM相当的精度,但是明显降低了模型复杂度和训练时间。(本文来源于《情报理论与实践》期刊2010年07期)

张玉峰,何超[7](2010)在《基于潜在语义分析和改进的HS-SVM的文本分类模型研究》一文中研究指出为提高文本分类的准确性与效率,提出一种基于潜在语义分析和改进的超球支持向量机的文本分类模型。该模型利用潜在语义分析进行特征抽取,消除同义词和多义词在文本表示时所造成的偏差,实现文本向量的降维。针对超球重迭区域的文本分类问题,设计一种新的决策方法—基于密集度的决策策略。实验结果表明,该模型在类别数目较小时具有较好的分类效果,改进的算法有效可行。(本文来源于《图书情报工作》期刊2010年10期)

莫海波[8](2008)在《潜在语义索引分类模型的研究与改进》一文中研究指出针对向量空间模型表示法的局限性,采用潜在语义索引在语义层面进行处理,是近几年提出的一种文本表示方法。潜在语义索引是利用统计计算导出文本中的潜在的语义进行索引,而不是在传统的字词上进行索引。本文的研究工作是基于潜在语义索引的分类模型。针对向量空间表示模型的高维性、松散性、仅体现词汇层面的缺点,在K-近邻和支持向量机分类算法的基础上,应用了潜在语义索引对原始的词*文档矩阵进行了消减,得到信息更为丰富、准确、浓缩的语义空间,与向量空间模型的特征空间进行了详细全面的比较。实验结果表明在几乎相同的F1值下,基于潜在语义索引的分类模型仅仅使用50维就能达到向量空间模型1000维同样的效果,所用的特征向量仅仅为后者的1/20。本文还用实验数据详细说明了基于各种不同的特征词选择算法,即使特征词变化比较大,基于潜在语义索引的K-近邻和支持向量机分类模型在实验中有着较好的稳定性和有效性,保持一个稳定的F1值。本文还针对K-近邻分类算法的局限性,改进了传统的K-近邻算法,提出了一种基于中心距离的K-近邻改进算法。传统的K-近邻算法有诸多局限,比如在训练样本分布类内距离较小而类间距离较大的情况下才有较理想的分类效果,但是实际情况遇到训练样本很松散,当训练样本处于边界分布和分布不均时,K-近邻算法存在弊端。本文提出的基于中心距离的改进算法,综合考虑了训练样本的分布情况,避免了边界分布和不均分布对K-近邻造成的影响。实验结果表明,宏平均F1值从83.6%提高到88.5%,证明了改进的有效性。(本文来源于《大连理工大学》期刊2008-12-01)

叶浩[9](2006)在《基于类信息的潜在语义多类文本分类模型研究》一文中研究指出在当前信息快速膨胀的时代,人工对文本信息进行分类是一种效率十分低下的工作。文本自动分类技术利用计算机强大的自动处理功能,极大的提高了工作的效率。目前,比较成熟的分类器有Rocchie算法,Na(?)ve Bayes算法,KNN算法,SVM算法等。 但是以上这些算法的本质都是二元分类算法,而在文本分类中,我们往往需要处理多类分类问题。在应对多类分类任务时,现今通常的解决方法是通过构造多个二元分类器,并将他们组合起来形成一个多类分类器。组合的方法有一对多(One-Against-Rest),一对一(One-Against-One)等等。但是这些方法的缺点在于首先忽视了文档的多类属性,而且需要训练大量的二元分类器,对于K类的多类问题,One-Against-Rest方法需要K个二元分类器,One-Against-One方法需要((?))个二元分类器。用每个二元分类器分类后将结果进行组合,最终确定输出。 针对多类分类算法的复杂性,我们在基于潜在语义分类模型的基础上,提出了基于类信息的潜在语义多类分类算法(Multivariate Partial Least-square Classifition:MPLC)。它通过将文档的多类标签属性表示成为一个文档类别信息矩阵,进行潜在语义索引,利用偏最小二乘法提取词和类别之间的潜在语义对,利用潜在语义对来对文本进行分类。通过建立类别信息矩阵,首先解决了文档的多类属性,同时避免了同时训练多个二元分类器的复杂过程。试验结果表明,我们的算法具有较好的稳定性和精度。其性能比目前表现较好的KNN、SVM算法都有所提高。 本文创新之处包括: 1.利用训练文档的类信息对文本分类模型进行建模,提取对分类贡献较大的特征。 2.基于潜在语义模型,提出一个新的多类分类算法MPLC; 3.利用偏最小二乘回归,避免了奇异值分解算法的繁重计算。(本文来源于《江西师范大学》期刊2006-05-01)

叶浩,王明文,曾雪强[10](2005)在《基于潜在语义的多类文本分类模型研究》一文中研究指出在文本分类中,一个文本往往有多类属性,而目前大多数分类模型均为二元分类模型。因此,提出一种基于潜在语义的多类分类模型。该模型同时考虑文档特征信息和文档的类属信息,在提取文档潜在语义信息的同时把对文档分类贡献大的特征信息保留下来。其结果是既能较好地解决文档中同义词和多义词的问题,又能解决多类属分类问题,并且能够探测到新类。在R eu ters文档集上的实验表明,在维数较低的情况下,分类效果比较好,性能比较稳定。(本文来源于《清华大学学报(自然科学版)》期刊2005年S1期)

基于分类的潜在语义模型论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

提出一种基于潜在概率语义(PLSA)模型和K近邻分类器的音频分类算法.首先,将信号特征向量送入潜在概率语义模型中训练,获得声音主题词袋模型;然后,使用K近邻分类器(KNN)进行分类.实验结果表明:与传统的K近邻分类算法相比,提出的算法在分类效果上有较明显的改善.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

基于分类的潜在语义模型论文参考文献

[1].吕海峰,蔡明.基于概率潜在语义分析模型的分类融合图像标注[J].电子技术与软件工程.2018

[2].辛欣,陈曙东,仝明磊,胡文皓,刘陈伟.采用潜在概率语义模型和K近邻分类器的音频分类算法[J].华侨大学学报(自然科学版).2016

[3].陶超,谭毅华,彭碧发,田金文.一种基于概率潜在语义模型的高分辨率遥感影像分类方法[J].测绘学报.2011

[4].苏麒匀.基于概率的潜在语义分析模型在搜索引擎商业文本分类系统中的应用研究[D].北京交通大学.2011

[5].戎怡.局部描述特征结合概率潜在语义模型的场景分类技术研究[D].燕山大学.2010

[6].张玉峰,何超.基于潜在语义分析和HS-SVM的文本分类模型研究[J].情报理论与实践.2010

[7].张玉峰,何超.基于潜在语义分析和改进的HS-SVM的文本分类模型研究[J].图书情报工作.2010

[8].莫海波.潜在语义索引分类模型的研究与改进[D].大连理工大学.2008

[9].叶浩.基于类信息的潜在语义多类文本分类模型研究[D].江西师范大学.2006

[10].叶浩,王明文,曾雪强.基于潜在语义的多类文本分类模型研究[J].清华大学学报(自然科学版).2005

标签:;  ;  ;  ;  

基于分类的潜在语义模型论文-吕海峰,蔡明
下载Doc文档

猜你喜欢