主题标注论文-武强,贺培凤,邰杨芳,卢学春,晋晓强

主题标注论文-武强,贺培凤,邰杨芳,卢学春,晋晓强

导读:本文包含了主题标注论文开题报告文献综述及选题提纲参考文献,主要关键词:主题资源,标注行为,社会化标签,标签标注

主题标注论文文献综述

武强,贺培凤,邰杨芳,卢学春,晋晓强[1](2019)在《社会化标注系统中不同主题资源的用户标注行为差异分析》一文中研究指出采用自主研发的软件抓取豆瓣网用户对互联网、健康、心理学等主题资源的标注标签数据,利用标签类型比率量化指标、统计描述法和差异分析法从7方面分别进行系统性分析,结果显示不同主题资源在语言类型、标注倾向和词来源3个方面对用户标注行为产生显着影响。(本文来源于《医学信息学杂志》期刊2019年09期)

凌洪飞,欧石燕[2](2019)在《面向主题模型的主题自动语义标注研究综述》一文中研究指出【目的】对面向主题模型的主题自动语义标注方法进行总结与评述,以促进主题模型的发展与应用。【文献范围】在Web of Science和CNKI数据库中分别以"Topic Labeling OR Topic Labelling OR Topic Tagging ORTopicIndexing"和"主题模型AND(标注OR标签)"等检索式进行检索,通过手工筛选获得代表性文献57篇。【方法】对相关论文进行深入阅读与分析,以主题标注过程中主题标签的生成来源为线索,对已有方法进行分类与比较分析。【结果】面向主题模型的主题自动语义标注包括候选标签生成与排序两个主要步骤,根据候选标签的生成来源可分为依靠自身语料库和依靠外部语料库两类方法。【局限】目前该领域的研究还不是很丰富,分析与评述不够系统和全面。【结论】该领域的研究仍具有较大探索空间,面向社交媒体内容的主题语义标注是未来研究方向,可结合更丰富的知识库并采用深度学习技术进行改进提升。(本文来源于《数据分析与知识发现》期刊2019年09期)

张蕾,蔡明[3](2019)在《基于主题融合和关联规则挖掘的图像标注》一文中研究指出为减小"语义鸿沟",在LDA主题模型的基础上,提出了一种主题融合和关联规则挖掘的图像标注方法。首先,针对视觉和文本信息的关联度不高的问题,引入基于向量机的多类别分类得到图像的类别信息。其次,通过文本模态的语义主题分布和类别信息,计算出图像类的文本主题分布。未知图像将其所属类的文本主题分布与其视觉主题分布进行加权融合,并以此概率模型计算初始标签集。最后依据初始标注词概率,利用关联规则挖掘和词间相关性挖掘文本关联度,从而得到精确化语义标注。在Corel5K图像数据集上进行对比实验,实验结果证明了方法的有效性。(本文来源于《计算机科学》期刊2019年07期)

张蕾[4](2019)在《基于主题模型的图像标注方法研究与应用》一文中研究指出由于大数据技术的高速发展,网络中的无标签图像展现出巨大的商业价值,如何快速筛选并使用这些无标签图像数据成为一个极具研究价值的问题。图像检索可以高效检索出需要的图像,而其在无标签图像数据的检索效果依赖于图像标注方法。在图像标注领域,由于图像的视觉内容和文本语义之间存在极大的差异,提出优秀的图像标注算法或改进现有图像标注模型依旧是一个十分具有挑战性的工作。本文围绕图像标注模型的改进、深度学习如何与传统图像标注模型结合展开研究,主要工作内容如下:(1)提出了基于主题融合和关联规则挖掘的图像标注方法,此方法是对基于LDA主题模型的图像标注方法的改进。LDA主题模型将图像视觉模态和文本模态的数据视为相互独立,并在此基础上生成对应模态的主题分布,因此图像不同模态的主题相互独立。为了增强图像视觉数据和文本数据的联系,在模型训练和图像标注阶段均进行不同模态的加权主题融合。基于LDA主题模型的图像标注以及其模型改进都没有考虑图像文本信息之间的关联对图像标注的影响,因此可利用图像文本信息的关联对主题模型的标注结果进行改善。利用改进的LDA图像标注方法获得初始标注词集,然后采用关联规则挖掘算法对初始标注词集进行挖掘找出图像的潜在标注词集。计算图像集所有文本标注词的词间相关性,然后将潜在标注词的词间相关性与基于改进LDA主题模型得到的标注词概率融合,对初始标注词集进行调整,从而改善图像标注的性能。(2)提出了融合卷积神经网络和主题模型的图像标注方法,此方法是深度学习与传统图像标注模型的结合。利用LDA主题模型对图像训练集的文本数据建模,生成图像训练集的潜在文本主题分布和文本主题标注词分布,对图像训练集文本数据的处理弥补了卷积神经网络分类训练集中文本数据维度大,分布稀疏的问题;卷积神经网络提取图像的高层视觉特征弥补了传统图像特征提取复杂和传递图像视觉信息有限的问题。为了提高图像低频文本主题的分类召回率,对卷积神经网络分类训练集中的高频文本主题进行平滑处理。然后利用图像的高层视觉特征和对应的潜在文本主题构建卷积神经网络分类器并进行图像文本主题多标签分类,获得图像的文本主题分布。该文本主题分布和LDA主题模型生成的文本主题标注词分布根据主题模型图像标注词概率的计算公式可得到图像标注词概率,从而确定图像的标注词集。在图像数据集中,将本文改进的图像标注方法与传统图像标注模型进行对比,本文改进的图像标注方法在召回率和准确率上都有一定的提高。将本文提出的结合深度学习和主题模型的图像标注方法与传统图像标注模型相比,该图像标注方法的性能远胜于传统图像标注方法;与当前较为先进的图像标注和基于深度学习的图像标注相比,该图像标注方法在准确率上表现略差,但在召回率有一定的提升。(本文来源于《江南大学》期刊2019-06-01)

张蕾,蔡明[5](2019)在《融合卷积神经网络与主题模型的图像标注》一文中研究指出为降低图像文本数据的稀疏性和传统图像特征的局限性,提出一种融合卷积神经网络(CNN)和主题模型的图像标注算法。利用狄利克雷主题模型对图像训练集的文本数据进行建模,生成文本主题分布和文本主题标注词分布,以降低图像文本数据的维度和稀疏性。考虑到图像文本主题的稀疏分布,利用CNN提取图像的高层视觉特征,同时改进损失函数以重构CNN。利用图像的高层视觉特征和对应的多个文本主题构建多分类器,进行图像文本主题多标签分类学习,并获得图像的文本主题分布。最后,将该文本主题分布和主题模型生成的文本主题标注词分布融合计算出图像的标注词概率。由Corel5K和IAPR TC-12图像标注数据集的对比实验可知,本文方法有效提高了图像的标注性能。(本文来源于《激光与光电子学进展》期刊2019年20期)

丁玲[6](2019)在《社会化标注中集成主题优化的协同推荐研究》一文中研究指出社会化标注系统作为移动社会化应用平台,用户标注活动日趋活跃。随着用户、资源和标签数量的不断增加,系统逐渐呈现出数量大、增长快、复杂多样以及质量不稳定不可靠等“大数据化”特征,极大地增加了推荐的复杂度,社会化标注中推荐服务的效率和效果矛盾日益突出。因此,本文结合国家自然科学基金项目“泛在计算环境中社会化驱动的情境感知个性化信息服务研究”(项目编号:71471165),针对“大数据化”标签数据存在的冗余性、不确定性和不一致性等问题,引入主题优化环节,研究并提出了社会化标注中集成主题优化的协同推荐方法。本文的主要工作和贡献如下:(1)提出集成优化过程的推荐服务模式。结合先优化后服务的思路,将社会化标注中的推荐实现过程分为线下主题优化和线上推荐服务两个过程。通过优化过程和服务过程的集成实现高质量、高效率的个性化推荐服务。(2)利用改进的LDA模型进行标签主题优化。以“用户-标签”二元关系为基础,利用用户标注行为特点改进LDA模型,挖掘潜在的标签主题。将原本杂乱的标签划分成具有一致主题的簇,消除标签本身存在的冗余性、不确定性和不一致性。(3)提出集成主题优化的协同推荐方法。通过线下对标签数据进行主题优化,建立“用户-主题”偏好模型和“主题-资源”权重模型。最终构建用户在多兴趣主题下对资源的偏好模型,从而提高线上推荐的效率。(4)采用Movielens数据集进行实验探究。利用准确率、召回率、F值和多样性指标衡量推荐的质量,利用时间复杂度及推荐生成总时间指标衡量推荐的效率。在获取推荐方法最优参数的情况下,设置多组对比实验,综合探究提出的方法在推荐质量和效率上的平衡效果。研究表明,本文提出的集成主题优化的协同推荐方法优于传统的协同推荐方法,尤其体现在推荐的多样性指标上。此外,该方法有效地提高了用户可见的线上推荐效率,实现了推荐效果和效率的平衡。本文的研究结果对于高质量、高效率的推荐服务具有较高的实践应用价值。(本文来源于《浙江理工大学》期刊2019-03-01)

张云中,冯双双[7](2018)在《基于主题图的数字档案标注系统资源聚合研究》一文中研究指出[目的/意义]针对社会化标注系统用于数字档案资源组织后带来的资源检索与导航问题,提出依托主题图的数字档案资源聚合模型,以期提高数字档案资源检索效率并建立有序的可视化导航。[方法/过程]在剖析利用主题图实现社会化标注系统资源聚合相关研究现状的基础上,构建数字档案领域基于主题图的资源聚合模型,给出利用社会网络分析和形式概念分析析取数字档案资源主题图的主题类型、关联关系及资源指引叁要素的体系化解决方案,从而实现数字档案标注系统资源聚合。[结果/结论]以NARA数字档案标注系统中的"Women at War"话题为例,利用所提方法并结合Ontopia工具实现目标话题的数字档案资源聚合,有效提高系统中数字档案资源的检索效率和导航效果。(本文来源于《图书情报工作》期刊2018年14期)

武强[8](2018)在《社会化标注系统中不同主题资源的用户标注行为分析》一文中研究指出目的社会化标注是Web 2.0技术的典型应用。随着互联网的发展和普及,越来越多的互联网应用平台均采用社会化标注功能,允许众多用户以标签的形式参与到网络信息资源的评论和分享,以便用户描述并揭示网络信息资源的内容。然而,社会化标签存在着选择随意、语义表达模糊、义同词不同以及词同义不同等问题,降低了用户对信息资源的使用效率,限制了标签的实际应用效果;同时,也在一定程度上降低了基于标签的信息组织和检索系统的质量。本文选题来源于国家社会科学基金项目“基于框架网络本体的标签系统语义分析研究”(13TCQ030)。通过标签对社会化标注系统中不同主题资源的用户标注行为分析与研究,一方面能够真实地揭示和了解用户在社会化标注系统中的标注动机和标注方式等信息,达到全面理解用户标注行为的目的;另一方面能够找出制约用户检索、利用和管理网络信息资源的主要因素,以此改进标签的使用;进一步提高网络信息组织和检索效率,充分实现对资源信息的传播、共享与利用;同时,能够优化社会化标注系统的结构功能和应用服务,达到全面促进社会化标注系统可持续发展的目的。方法基于自主开发的标签抓取软件(社会化标签知识采集系统)对社会化标注资源网站豆瓣网上“互联网”、“健康”与“心理学”主题资源数据抓取,运用文献调研法整理相关文献,提出本课题研究方向;运用实证研究法、统计描述法、差异分析法从标签的语言类型、词性统计、用语规范性、功能类型、情感、标注倾向、词来源等方面进行了定量分析和标签类型比率的用户标注行为量化指标进行了定性分析。结果特征分析的结果表明:①用户偏向使用名称、动词、形容词等词性的中文标签;②用户的标签用语具有不规范性,更多时候用户选择非叙词和非类目名称词作为标签标注资源;③用户倾向使用具有描述型功能的主题词标签进行标注资源用来揭示图书主题内容;④用户偏向使用评价型标签和情感型标签标注资源,便于其他用户关注该资源并有利于资源的分享;⑤用户标签标注倾向不高,大部分用户从未对图书添加标签,并且标签来源于标题的占比偏低。差异分析的结果表明:不同主题资源对用户标注行为存在显着性差异体现在标签的语言类型、标注倾向和词来源等方面,在标签的词性统计、用语规范性、功能类型和情感等方面不同主题资源对用户标注行为显着性差异不明显。结论社会化标注系统应该从提高个性化推荐服务功能、增加对不规范标签的纠正功能、完善标签检索功能、增加标签导航功能和完善标签浏览方式等方面进行结构功能和应用服务的优化,对促进社会化标注系统的可持续发展具有重要意义。(本文来源于《山西医科大学》期刊2018-05-20)

黄进,周栋[9](2018)在《一种融合社会化标注系统中主题域相似的个性化排序方法》一文中研究指出随着网络技术的发展,互联网中越来越多的资源被应用于信息检索中,大量的研究表明,社会化标注可以用于改善信息检索。现有个性化排序的方法中,用户之间的相似度大多通过其共同使用过的标签集来计算。然而,现实中用户标注数据存在稀疏性和标签同义词等问题,导致相似度计算并不准确。在前人研究的基础上,提出了一种融合主题域相似的个性化排序方法。该方法首先通过主题域的划分,将不同主题含义的网页及标签分开,通过构建的标签相似网络找出标签同义词。然后结合用户标签和主题偏好找出兴趣相近的用户,并对用户的标注信息进行扩展,从而能够有效地改善个性化信息检索的效果。在真实数据上的实验结果表明,该方法能有效缓解标注稀疏性和标签同义词问题,有助于改善用户检索体验。(本文来源于《计算机工程与科学》期刊2018年05期)

窦燕[10](2018)在《社会化标注系统中基于LDA主题模型的标签推荐研究》一文中研究指出Web2.0自2004年被提出之后就得到了广泛关注,其以“用户”为中心注重人机交互的理念,使用户不再处于被动阶段,而是掌握住了主动权,能够随时随地与Web产生交互,他们既是互联网信息的接受者,也是网络信息的创造与发布者,在这开放的互联网环境中人人能参与、能创造、能共享信息。社会化标注是Web2.0时代一种新兴的网络信息资源组织方式,其由用户根据自己的意愿为网络中各种资源使用关键词即标签(Tag)进行标注,以实现有效组织、分类和检索等目的,目前被广泛应用,但其自由性与无控性所产生的问题开始也逐渐显现,影响了其效用的发挥。为达到规范标签,改善标签质量,标签推荐受到了越来越多的关注。在这种背景下,本文基于对目前社会标注系统、现存标签推荐系统的深入分析,包括对其实现原理和优劣势的分析后,针对如何把多种标签来源融合在一起从而提升标签推荐结果的全面性与准确性,以混合推荐方法为突破口,结合目前主流的个性化推荐技术,同时引入LDA主题模型及信任机制,构建一种多源型的标签混合推荐模型,融合叁种推荐方法即基于资源内容的推荐、基于资源的协同过滤和基于用户的协同过滤共同形成最后推荐结果,并详细阐明该推荐模型的实现方法,最后通过“豆瓣读书”进行相关的实证研究。本文一共有六个章节:第一章阐述了本研究的背景和意义,并对国内外的有关研究情况进行阐述,并明确了本文的研究内容、方法等。第二章是对社会化标注系统、目前个性化推荐技术及信任机制相关理论的介绍,包括社会标注系统的定义、应用、推荐原理、几种传统的个性化推荐技术和信任机制的定义、性质及其分类。第叁章探讨了几种主题模型的相关内容,包括其概念基础和工作原理,介绍了当前主流的一些相似度计算方式及基于LDA的相似度计算,并为后续模型的构建作了铺垫。第四章构建标签混合推荐模型并对其进行阐述。包含叁种推荐方法:第一种是基于内容的标签推荐,主要利用TF-IDF从资源本文内容中抽取关键词作为得到标签候选列表;第二种是基于相似资源的标签推荐,主要是利用LDA对资源的文本内容进行主题模型训练,计算资源的相似度,得到推荐的候选结果;最后是基于相似用户的标签推荐,主要是利用LDA对用户进行主题模型训练,从而得到用户的相似性,并同时引入信任机制,通过对用户相似度及信任度的合并基础上产生基于用户的标签候选列表;最后对叁种候选列表进行合并,得出最后的标签推荐结果。第五章为模型的实证阶段。以“豆瓣读书”为对象,爬取数据并结合本文提出的模型各步骤进行实证研究,从而验证模型的有效性及可用性。第六章对全文进行了总结,并在分析过本文研究的不足之处后,对下一步工作提出了展望。(本文来源于《华中师范大学》期刊2018-05-01)

主题标注论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

【目的】对面向主题模型的主题自动语义标注方法进行总结与评述,以促进主题模型的发展与应用。【文献范围】在Web of Science和CNKI数据库中分别以"Topic Labeling OR Topic Labelling OR Topic Tagging ORTopicIndexing"和"主题模型AND(标注OR标签)"等检索式进行检索,通过手工筛选获得代表性文献57篇。【方法】对相关论文进行深入阅读与分析,以主题标注过程中主题标签的生成来源为线索,对已有方法进行分类与比较分析。【结果】面向主题模型的主题自动语义标注包括候选标签生成与排序两个主要步骤,根据候选标签的生成来源可分为依靠自身语料库和依靠外部语料库两类方法。【局限】目前该领域的研究还不是很丰富,分析与评述不够系统和全面。【结论】该领域的研究仍具有较大探索空间,面向社交媒体内容的主题语义标注是未来研究方向,可结合更丰富的知识库并采用深度学习技术进行改进提升。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

主题标注论文参考文献

[1].武强,贺培凤,邰杨芳,卢学春,晋晓强.社会化标注系统中不同主题资源的用户标注行为差异分析[J].医学信息学杂志.2019

[2].凌洪飞,欧石燕.面向主题模型的主题自动语义标注研究综述[J].数据分析与知识发现.2019

[3].张蕾,蔡明.基于主题融合和关联规则挖掘的图像标注[J].计算机科学.2019

[4].张蕾.基于主题模型的图像标注方法研究与应用[D].江南大学.2019

[5].张蕾,蔡明.融合卷积神经网络与主题模型的图像标注[J].激光与光电子学进展.2019

[6].丁玲.社会化标注中集成主题优化的协同推荐研究[D].浙江理工大学.2019

[7].张云中,冯双双.基于主题图的数字档案标注系统资源聚合研究[J].图书情报工作.2018

[8].武强.社会化标注系统中不同主题资源的用户标注行为分析[D].山西医科大学.2018

[9].黄进,周栋.一种融合社会化标注系统中主题域相似的个性化排序方法[J].计算机工程与科学.2018

[10].窦燕.社会化标注系统中基于LDA主题模型的标签推荐研究[D].华中师范大学.2018

标签:;  ;  ;  ;  

主题标注论文-武强,贺培凤,邰杨芳,卢学春,晋晓强
下载Doc文档

猜你喜欢