潜在语义分析概率论文-吕海峰,蔡明

潜在语义分析概率论文-吕海峰,蔡明

导读:本文包含了潜在语义分析概率论文开题报告文献综述及选题提纲参考文献,主要关键词:图像自动标注,词袋,支持向量机,概率潜语义分析

潜在语义分析概率论文文献综述

吕海峰,蔡明[1](2018)在《基于概率潜在语义分析模型的分类融合图像标注》一文中研究指出图像自动标注作为计算机视觉领域重要的研究课题,近年来取得了巨大的成果,但由于语义鸿沟的存在,仍然存在巨大的挑战。本文提出一种基于概率潜在语义分析模型的分类融合图像标注方法。首先,该方法分别提取图像的形状和视觉特征,聚类生成词袋;然后利用融合概率潜在语义分析模型计算得出图像标注词的概率,并利用支持向量机依据图像颜色特征分类得到分类标签的类别权重;最后在得到的标注词概率中融入类别权重,最终得到图像的标签。并且使用Corel图像数据集进行标注模型的训练和图像的标注。实验结果表明,对比几种前沿的标注方法,本文获得了良好的性能。(本文来源于《电子技术与软件工程》期刊2018年07期)

Kutlumuratov,Assylbek[2](2016)在《基于概率潜在语义分析的词汇情感倾向判别》一文中研究指出文章针对概率潜在语义分析对称参数表示模型进行了分析,并探析了基于概率潜在语义分析的词汇情感倾向判别,以供参考。(本文来源于《科技经济导刊》期刊2016年11期)

林江豪,周咏梅,阳爱民,陈昱宏,陈晓帆[3](2015)在《基于概率潜在语义分析的群体情绪演进分析》一文中研究指出针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句法关系和情感本体库,抽取与话题内容相匹配群体情绪单元,计算情绪单元的强度,形成情绪特征向量;最后,对各子话题下的情绪强度进行求和,细粒度分析子话题和事件的整体群体情绪,深入挖掘群体情绪演进规律,并将群体情绪量化和可视化。在话题情绪单元抽取过程中,引入了句法规则和情感本体库,更细粒度地抽取情绪单元,并提高了话题内容与情绪单元匹配的准确性。实验结果表明,该模型能够实现话题内容及其群体情绪按时序特征的演进分析,验证了所提方法的有效性。(本文来源于《计算机应用》期刊2015年10期)

赵伟[4](2014)在《基于并行计算的概率潜在语义分析算法研究》一文中研究指出概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)中通过将文档—单词关系转变成文档—主题—单词关系对文档进行排序、过滤、分类等操作,计算量巨大。文章设计了基于MPI(Message Passing Interface)的PLSA高效并行方案,对模型系统和训练数据处理以及并行算法加以优化,提出了一种大数据条件下PLSA并行算法,解决了以往数据规模太大难以计算的问题,算法较优化前训练速度有较大提升,具有扩展性和可行性。(本文来源于《安徽职业技术学院学报》期刊2014年03期)

王一鸣[5](2014)在《基于动态阈值模型的概率潜在语义分析方法》一文中研究指出目标识别与目标定位是计算机视觉领域的一个重要分支,随着数字图像在互联网上的爆炸式增长,基于图像局部特征的目标匹配开始在图像检索中占据越来越重要的地位,图像的整体分类已很难满足所有的图像检索需求,如何精确而有效地实现目标识别与目标定位成为图像研究领域的一个关键问题。概率潜在语义分析(Probabilistic Latent SemanticAnalysis,PLSA)是一种基于统计学的自然语言处理方法,能够有效挖掘隐藏在文本字面数据下的潜在语义结构,是最早的主题模型方法。在图像应用领域,将PLSA作为一种主题挖掘工具,成功实现了非监督形式的目标识别与目标定位功能。但在实践中存在过度拟合的问题,时常出现主题隶属度不明确和多个主题过度相似的现象。针对以上问题,本文提出一种基于动态阈值模型的PLSA方法,所完成的主要工作包括:(1)提出一种高效的稀疏化方法,通过设置稀疏性控制阈值以达到忽略次要信息,凸显核心主题信息的目的。这种方法合理并有效地限制了每张图像所对应主题的数量,抑制冗余信息,成功解决了主题隶属度混乱的问题。(2)提出了基于语义相似性的主题合并策略。对于不同主题过于相似的问题,根据其语义相似性,动态地决定是否合并相似主题。目的是在确定目标的类信息保存完整的前提下,实现每个目标类只明确地对应于一个主题。这种策略还能够构造主题之间的层次结构关系,通过调整阈值的约束范围,可以实现主题在不同深度上的抽象,挖掘更高层次的潜在数据模式。本文实验表明:与已有的PLSA方法相比,本文所述的方法保持了高可靠度的隐藏模式发现能力,同时大大提高了精确度,并且成功实现了该类方法从无层次结构模型到多层次结构模型的扩展。(本文来源于《郑州大学》期刊2014-05-01)

季海峰,高隽,郑鹏,王婧[6](2014)在《多尺度空间判别性概率潜在语义分析的场景分类》一文中研究指出目的传统潜在语义分析(LSA)方法无法获得场景目标空间分布信息和潜在主题的判别信息。方法针对这一问题提出了一种基于多尺度空间判别性概率潜在语义分析(PLSA)的场景分类方法。首先通过空间金字塔方法对图像进行空间多尺度划分获得图像空间信息,结合PLSA模型获得每个局部块的潜在语义信息;然后串接每个特定局部块中的语义信息得到图像多尺度空间潜在语义信息;最后结合提出的权值学习方法来学习不同图像主题间的判别信息,从而得到图像的多尺度空间判别性潜在语义信息,并将学习到的权值信息嵌入支持向量机(Support Vector Machine,SVM)分类器中完成图像的场景分类。结果在常用的3个场景图像库(Scene-13、Scene-15和Caltech-101)上的实验结果表明,本文方法平均分类精度比现有许多state-of-art方法均优。结论充分说明了空间信息和判别性信息在场景分类中的重要性,并进一步验证了其有效性和鲁棒性。(本文来源于《中国图象图形学报》期刊2014年01期)

周成豪[7](2013)在《基于概率潜在语义分析的音频场景识别方法》一文中研究指出随着音视频网络的飞速发展和人们生活水平的不断提高,各种记录日常生活点滴的音视频文件如潮水般涌现在各大音视频网站,并伴随着人为主题标注的主观性和随意性,以及录制工具带来的音视频质量差异性,给管理和识别这些音视频文件带来巨大挑战。因此,急需有效的智能系统对这些音视频文件进行分门别类的管理,而且,以声音为决策依据的智能系统不仅能在管理和识别音频文件领域有着不可替代的作用,还可以通过分析视频文件的伴音信息对基于视觉的智能系统提供技术支持和补充。音频场景识别是解决以上问题的有效手段之一。音频场景可以看作是刻画和区分音频内容的一种特定的语义标签,它由一系列语义上相关、时间上相邻的声学事件构成。因而音频场景识别实质上是对音频内容语义层面的识别和理解。传统的音频场景识别方法主要分为叁类:其一是基于启发式规则的音频场景识别,一般是在提取音频特征之后通过将其与特定的特征阈值相比较来实现分类;其二是基于最小距离的音频场景识别方法,为每类音频场景建立模板,然后通过计算待测音频与模板间的相似度或空间距离进行识别;其叁是基于统计理论的音频场景识别,如基于高斯混合模型的音频识别方法和基于隐马尔可夫的音频场景识别方法等。简单来说,上述方法不是直接识别音频场景,而是通过检测与特定音频场景紧密相关的关键声学事件的出现来间接识别音频场景。这种基于关键声学事件的识别策略对实验环境和实验语料的要求较高,在识别相似的音频场景时力不从心,提取或定义相似音频场景的关键声学事件的难度非常大。尽管如此,基于关键声学事件的音频场景识别方法仍然极具借鉴意义,可以通过对共现声学事件的挖掘在广义上对基于关键声学事件的音频场景识别思想进行扩展。参照在文本语义分析中的研究方法,将共现声学事件视为同义词,将出现在多个场景的同一声学事件视为多义词。本文正是针对音频场景识别遇到的问题和需求提出一种消除声学事件同义性和多义性影响的音频场景识别方法,方法的核心是概率潜在语义分析模型。基于概率潜在语义分析的音频场景识别方法的首要步骤是构建声学事件类字典,这一过程主要通过高斯混合模型实现,高斯分量决定了某MFCC特征向量隶属哪一个声学事件类;其次是去除具有同义性和多义性的声学事件对音频场景识别的影响,这一步骤通过概率潜在语义分析模型完成;最后,通过支持向量机模型对概率潜在语义分析模型处理后的音频场景文件进行分类。为了检验基于概率潜在语义分析模型的音频场景识别方法的实验效果,本文以经典的基于MFCC长时统计特征和支持向量机模型的音频场景方法作为基线系统,音频长时统计特征在音频场景识别中的意义和支持向量机模型分类稳定性决定了基线系统的比较意义。接下来,本文对基于概率潜在语义分析模型的音频识别方法进行了改进,一方面通过近邻传播聚类算法实现音频场景文件的自由聚类,另一方面引入了音频场景分割的思想,将音频文件转化成由声学事件类按序构成的文件。音频场景分割是通过高斯模型构建的声学事件类字典指导完成,从而实现了完整意义下的基于内容的音频场景识别。研究结果表明,基于概率潜在语义分析的音频场景识别方法能够有效的处理同义的和多义的声学事件类对音频场景识别的影响,基于近邻传播聚类算法和音频场景分割改进的系统的性能有所提升。(本文来源于《哈尔滨工业大学》期刊2013-07-01)

张伟,黄炜,夏利民[8](2013)在《基于广义内容概率潜在语义分析模型的推荐》一文中研究指出针对推荐系统中存在新项目及准确性难以把握等问题,提出一种基于广义内容概率潜在语义模型的推荐方法。该方法以概率潜在语义模型为基础,引入两组潜在变量及项目特征来建立广义内容概率潜在语义模型。该模型中两组潜在变量分别表示用户群体和项目群体,项目特征根据实际情况以特征词的形式进行表示,且通过不对称学习算法完成未知参数的训练及预测。利用叁个不同的数据集对所提方法进行实验验证,结果表明该方法具有良好的项目推荐品质。(本文来源于《计算机应用》期刊2013年05期)

鄢萌[9](2013)在《基于概率潜在语义分析的软件变更分类研究》一文中研究指出软件变更是指软件开发者对软件系统的一次更改,在软件的整个生命周期中,追踪和理解软件变更发生的原因是一项重要且困难的任务。当前已经有研究者提出了基于关键词检索的方法来识别软件变更发生的原因,也取得了一定的成果,然而仍然存在一些尚未解决的问题,如在分析软件变更日志中存在的同义词与多义词问题。本文提出了一种基于半监督主题模型的方法来识别软件变更发生的原因,根据其原因对软件变更进行分类。研究对象为存储在软件版本控制系统(如SVN)中的软件变更日志,应用半监督主题模型对软件变更日志进行挖掘和分析,在主题提取上,采用了概率潜在语义分析Probabilistic Latent Semantic Analysis(PLSA)技术。主要工作内容如下:1.在软件版本库变更日志的数据抽取与预处理上,提出了联合CvsAnaly,GATE, Wordnet叁个工具的解决方案,并通过引用工具提供的API包实现了软件变更日志的数据抽取、存储与预处理;2.为解决以往基于关键词检索的软件变更分类中存在的同义与多义问题,提出了基于PLSA主题模型的解决方法,并利用Eclipse和MATLAB平台完成核心算法的编写;3.在应用PLSA主题模型时,针对原始的PLSA对方法进行了两点改进:第一则是单词本的构建上,在基于原始PLSA的文本分析方法中,单词本是根据单词的频率排序进行构建,但软件工程领域的文本有着其特殊性,本文提出了一种基于软件变更先验知识的关键单词本构建方法;第二是在构建主题模型时,加入了软件变更领域的先验知识,通过加入部分带类标签的样本进行半监督主题建模来初始化词频矩阵,增加属于同一类别的关键单词的共现程度。4.通过在五个大型开源软件项目上的实验与验证,相比以往基于关键词检索的方法,本文所提出的基于半监督PLSA的分类方法能得到一个基于概率的,更恰当的以及更符合实际意义的分类结果。(本文来源于《重庆大学》期刊2013-05-01)

崔琳,谈成访,吴孝银[10](2013)在《基于概率潜在语义分析的Blog个性化查询扩展研究》一文中研究指出随着Web2.0技术的日益成熟和Blog技术的发展,Blog页面的数量呈指数级上升,只靠基于关键字匹配的Blog搜索引擎已满足不了用户的需要。传统Blog搜索引擎的搜索效率达不到用户个性化要求,受概率潜在语义分析技术研究的启发,将概率潜在语义分析模型用于Blog日志查询,根据用户的兴趣和个性化特点进行检索,返回与用户需求相关的查询结果。实验结果表明,相对于传统的向量空间模型和潜在语义分析模型,基于概率潜在语义分析模型的Blog日志查询在平均精度和召回率上得到了显着提高。(本文来源于《安阳师范学院学报》期刊2013年02期)

潜在语义分析概率论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

文章针对概率潜在语义分析对称参数表示模型进行了分析,并探析了基于概率潜在语义分析的词汇情感倾向判别,以供参考。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

潜在语义分析概率论文参考文献

[1].吕海峰,蔡明.基于概率潜在语义分析模型的分类融合图像标注[J].电子技术与软件工程.2018

[2].Kutlumuratov,Assylbek.基于概率潜在语义分析的词汇情感倾向判别[J].科技经济导刊.2016

[3].林江豪,周咏梅,阳爱民,陈昱宏,陈晓帆.基于概率潜在语义分析的群体情绪演进分析[J].计算机应用.2015

[4].赵伟.基于并行计算的概率潜在语义分析算法研究[J].安徽职业技术学院学报.2014

[5].王一鸣.基于动态阈值模型的概率潜在语义分析方法[D].郑州大学.2014

[6].季海峰,高隽,郑鹏,王婧.多尺度空间判别性概率潜在语义分析的场景分类[J].中国图象图形学报.2014

[7].周成豪.基于概率潜在语义分析的音频场景识别方法[D].哈尔滨工业大学.2013

[8].张伟,黄炜,夏利民.基于广义内容概率潜在语义分析模型的推荐[J].计算机应用.2013

[9].鄢萌.基于概率潜在语义分析的软件变更分类研究[D].重庆大学.2013

[10].崔琳,谈成访,吴孝银.基于概率潜在语义分析的Blog个性化查询扩展研究[J].安阳师范学院学报.2013

标签:;  ;  ;  ;  

潜在语义分析概率论文-吕海峰,蔡明
下载Doc文档

猜你喜欢