导读:本文包含了语义信息特征论文开题报告文献综述及选题提纲参考文献,主要关键词:Web挖掘,电子商务,轻量级,语义特征提取
语义信息特征论文文献综述
徐里萍,侯玲,张建欣,赵丽[1](2019)在《利用改进型语义特征的Web商品信息挖掘方法》一文中研究指出针对于互联网商品信息数据量庞大的问题,提出一种基于改进型轻量级语义特征提取的web商品信息挖掘方法。首先,通过分析网站链接的层级关系,采用层次访问的方式抓取电子商店的网站URL。其次,采用改进型轻量级语义特征提取方法对元素进行聚类以实现电子商店页面内商品记录的提取。最后,利用产品属性格式和产品记录结构的常识信息进行正则匹配,实现商品属性的提取。实验采用该方法提取来自不同国家的两个电子商店网站不同产品的属性,实验结果表明,提出的方法较好地兼顾了信息提取的完整性和准确性,商品信息的平均提取准确率可高达98. 39%。(本文来源于《信息技术》期刊2019年07期)
杨从先[2](2019)在《基于跨媒体语义特征的在线社交网络国民安全信息搜索研究》一文中研究指出随着社交网络用户群体的日益扩大,社交网络中每天产生的数据也越来越多,社交网络中的数据往往存在着噪声性、多样性及语义稀疏性等问题。针对社交网络数据存在的上述问题,本文对社交网络跨媒体时空特性数据的感知获取、社交网络跨媒体数据的语义提取建模,社交网络数据跨媒体语义搜索进行研究,最终实现了基于跨媒体语义特征的在线社交网络国民安全信息搜索系统。论文完成的主要工作如下:(1)在社交网络跨媒体时空特性数据的感知获取方面,针对社交网络数据广泛存在的噪声性、多样性问题,提出了一种社交网络国民安全时空特性数据获取方法。通过建立国民安全关键词词库,对社交网络跨媒体数据进行组织获取,过滤社交网络数据中存在的噪声信息,对社交网络跨媒体有效数据进行存储。通过提取社交网络对象时间信息、空间位置信息、用户状态信息等,对社交网络国民安全跨媒体数据的时空特性进行感知与获取。(2)在社交网络跨媒体数据的语义提取建模方面,针对社交网络数据存在模态形式多样以及语义稀疏性的特点,提出了基于时空主题词嵌入的文本语义建模算法(STTE)和时空跨媒体语义关联建模算法(STECM)。对于社交网络中的文本数据,结合数据的时空特性,对文本的时间信息和地理空间信息进行建模,通过结合语料数据中的全局和局部上下文信息,充分挖掘文本上下文之间的关联,获得最准确的特征,与传统的主题概率模型相比分类准确率提高了12.7%,与传统词嵌入模型相比分类准确率提高了9.2%。对于社交网络中的图像数据,通过卷积神经网络提取图像的深度特征,对图像数据的视觉特征进行抽象学习,获得图像的深度特征表示,并使用跨模态关联映射函数建立跨媒体数据间的语义映射关系,关联后的跨模态特征在社交网络国民安全数据上的分类性能提高了6.9%。(3)在社交网络数据跨媒体语义搜索方面,针对社交网络数据的多样性和噪声性问题,提出了基于深度随机游走的跨媒体语义关联映射算法(DWM),通过挖掘社交网络数据间的深度语义关联,实现了跨媒体语义关联映射。提出了基于语义扩展和深度哈希网络的社交网络跨媒体搜索算法(DHCS)。结合语义信息扩展和哈希编码,在社交网络跨模态搜索场景下,MAP指标与传统跨媒体空间搜索算法相比提高了13.1%,PR曲线指标相比对比算法提高了21.2%。(4)设计并实现了基于跨媒体语义特征的在线社交网络国民安全信息搜索系统。系统包括社交网络国民安全数据感知获取模块、社交网络国民安全数据特征提取建模模块,以及社交网络国民安全数据跨媒体语义空间搜索模块,实现了社交网络跨媒体国民安全信息的搜索。(本文来源于《北京邮电大学》期刊2019-05-29)
马语丹[3](2019)在《结合实体共现信息与句子语义特征的关系抽取》一文中研究指出随着信息技术的迅猛发展,互联网的广泛使用降低了信息的生产和传播成本,为群众获取信息带来了极大的便利。但随之而来的信息爆炸等问题,也给有效信息的获取和管理带来了艰巨的挑战。因此,如何从互联网上海量文字信息中,采用信息抽取方法获取信息的本质,服务于后续的信息管理与应用,具有重要意义。关系抽取作为信息抽取领域的重要任务,得到了研究学者的广泛关注。目前主流的关系抽取方法多以实体对所在句子为输入,使用神经网络的方法,为实体对提取语义特征,或加入外部信息作为补充,来进行关系分类。这类方法忽略了语料中可能存在句子长度较短、外部信息获取困难等问题。为了克服这些问题,本文从语料集的角度出发,认为其包含了对关系抽取可能有用的全局信息,并以此为基础提出了新颖的关系抽取方法,通过构建实体共现网络,同时提取全局上下文特征和句子级上下文特征,充分挖掘语料集中的宏观和微观上下文信息,实现关系分类。首先,标注了两个中文关系分类数据集。当前关系分类实验数据集较为匮乏,己有研究中使用的数据集多为英文数据集,如SemEval-2010和NYT-2010。考虑到中文和英文之间存在一定的差异,根据百度百科和新闻语料人工标注了两个用于关系分类的中文数据集,目前己将数据集开源。其次,提出了融合关系影响力与句子级特征的关系抽取模型(RASNN)。考虑到关系与关系之间的相互影响和制约,语料集中任意实体对之间的弱关系都可能成为关系分类的依据,本文提出了关系影响力的概念,通过使用注意力机制为实体共现网络中的共现关系计算影响力权重,并结合句子级上下文特征进行关系分类。该模型能够从宏观和微观两个角度为实体对抽取上下文特征,弥补了可能存在的因句子长度太短而造成的上下文信息不充分的问题。接着,提出了基于实体共现网络与句子语义信息的关系抽取模型(CNSSNN)。鉴于关系有强弱之分,实体的不同共现实体也应该有不同的重要程度,CNSSNN模型采用注意力机制为实体的不同邻居实体和实体对的共同邻居实体计算关系权重,并通过Bi-GRU和自注意力机制提取句子级上下文特征,深度挖掘实体对的宏观语料级上下文特征和微观句子级上下文特征。最后,将本文提出的RASNN模型、CNSSNN模型和当前主流的关系抽取方法在四个数据集上进行了对比实验和分析,结果表明,本文提出的模型能够通过实体共现网络挖掘实体对的语料级上下文特征,为句子级上下文特征提供有效的补充,关系抽取效果明显优于现有的关系抽取方法。(本文来源于《北京交通大学》期刊2019-05-01)
张稼,陆兴华[4](2019)在《基于语义关联特征的大型信息管理系统数据挖掘技术》一文中研究指出为了提高大型信息管理系统的数据检索和挖掘能力,提出了一种基于语义关联特征提取的大型信息管理系统数据挖掘技术。构建云存储模型进行大型信息管理系统中大数据分布式存储设计,结合大数据信息流的特征重组方法进行信息管理系统的优化结构重组,在重组的信息管理系统拓扑结构中提取信息管理分布数据的语义关联维特征量,以语义关联特征量为训练样本集进行信息管理系统的集成调度和数据挖掘,采用模糊C均值算法进行大型信息管理系统中分布数据语义关联特征的自适应融合和聚类处理,采用特征压缩器进行大型信息管理系统的存储空间降维处理,提高目标数据挖掘能力和信息管理系统的自适应调度能力。仿真结果表明,采用该方法进行大型信息管理系统数据挖掘的准确性较好,语义关联聚类性较强,提高了对信息管理系统目标数据的检索和调度能力。(本文来源于《电子测量技术》期刊2019年04期)
马语丹,赵义,金婧,万怀宇[5](2018)在《结合实体共现信息与句子语义特征的关系抽取方法》一文中研究指出实体关系抽取是信息抽取领域的重要任务之一,也是知识图谱构建的一个关键环节.现有的关系抽取方法大多都是围绕实体对从句子中抽取上下文语义特征,然后进行关系分类,这忽略了实体在整个语料集中的全局上下文特征.本文提出了一种新颖的结合实体共现信息与句子语义信息的神经网络(CNSSNN)模型,用于实体关系抽取.该模型首先构造整个语料集蕴含的实体共现关系网络,并通过引入注意力机制有侧重地提取实体的网络环境信息,从而为各个实体生成语料级全局上下文特征,同时利用双向门控循环单元网络(bi-GRU)为实体对提取句子级上下文语义特征,最后将语料级特征和句子级特征结合起来,进行实体关系抽取.在公开数据集和人工标注的数据集上的实验结果表明,本文提出的方法其准确率和召回率要明显优于其他现有方法.(本文来源于《中国科学:信息科学》期刊2018年11期)
戴婷婷[6](2018)在《从nothing的语义特征看比较句式的信息结构》一文中研究指出该文从包含nothing的两个比较结构的异同入手,讨论了nothing一词的语义和句法特征,同时分析了比较句式的信息结构。研究揭示了两种类型的比较句在深层结构上是不同的,此外,研究还运用语言的信息结构理论对比较句式的信息传递特征进行了分析。(本文来源于《海外英语》期刊2018年16期)
李远杰[7](2018)在《基于素描信息和贝叶斯网络特征学习的SAR图像语义分割》一文中研究指出随着SAR成像技术的快速发展,使得SAR图像解译技术的研究成为焦点,而SAR图像分割技术是研究SAR图像解译技术的前提和基础,也是SAR图像解译工作的重要组成部分。由于SAR图像存在混杂、异构、高维等特点,使得SAR图像特征提取工作困难重重,为SAR图像分割工作的进行添加了难度。本团队提出的层次视觉语义模型,将SAR图像划分成混合,结构以及匀质区域像素子空间,该模型很好的解决了SAR图像的异构问题,为SAR图像分割问题的解决打下了良好的基础。本文在此基础上,利用SAR图像素描图中素描线段的信息,提出了基于素描信息和贝叶斯网络特征学习的SAR图像语义分割方法,具体研究成果如下:(1)提出一种基于素描方向信息和特征学习的混合像素子空间分割方法。设计了素描方向统计向量对SAR图像混合像素子空间中的极不匀质区域进行表示。极不匀质区域地物结构复杂,背景信息丰富,传统方法很难提取到有效的特征。而SAR图像素描图是对SAR图像的稀疏表示,图中的素描线段包含了丰富的语义信息,依据素描线段方向特性设计特征抓住了图像地物明显的方向结构,通过对该人工特征的聚类完成混合像素子空间的初次聚类。结合人工特征和学习特征的优点,通过人工特征的初次分类结果,结合贝叶斯学习网络获得学习的特征,通过聚类方法完成分割,根据实验验证该方法是可行的。(2)提出一种基于聚类方法和特征相似度的分析方法对贝叶斯学习网络进行参数分析。网络参数选取的好坏直接影响着网络的训练能力和学习效果。通过网络输入层神经元参数和网络隐层神经元参数的不同选择,完成仿真实验,采用聚类方法和基于方差和均值的特征相似度方法,结合实验结果进行参数分析,选取最优参数,调整网络结构,增强网络学习性能,提高图像分割的准确度。(3)提出一种基于素描空间结构和贝叶斯学习网络的分割方法。依据素描线段的空间位置和长度信息,设计贝叶斯学习网络的约束条件,提高网络重构效果,增强网络学习性能,进行混合像素子空间的分割。用已有的方法完成匀质区域像素子空间和结构像素子空间的分割。融合合并所有像素子空间的分割结果得到最终的SAR图像分割结果。通过实验验证表明本文研究内容是有效可行的。(本文来源于《西安电子科技大学》期刊2018-06-01)
万福成,马宁,何向真[8](2018)在《融合事件特征及语义角色标注的藏文信息抽取技术》一文中研究指出本文在藏语短语句法分析的基础上,融入功能语义信息线索,采用在藏语短语句法树库的基础上加入语义角色标注的方法,并融合事件触发词信息,对藏文信息进行抽取,并通过实验进行了对比分析。本文事件特征融合与已标注信息对藏文信息抽取有帮助,本文模型可以很好地应用于藏文信息抽取工作。(本文来源于《广西师范大学学报(自然科学版)》期刊2018年02期)
邱庆羽,李婧,全兵,童超,张利君[9](2018)在《基于文献信息网络语义特征的相似性搜索》一文中研究指出文献信息网络是典型的异构信息网络,基于其进行相似性搜索是图挖掘领域的一个研究热点。然而,现有的方法主要采用元路径或元结构的方式,并未考虑节点自身的语义特征,从而导致搜索结果出现偏差。对此,基于文献信息网络提出了一种基于向量的语义特征提取方法,并设计实现了基于向量的节点相似性计算方法 VSim;此外,结合元路径设计了基于语义特征的相似性搜索算法VPSim;为提高算法的执行效率,针对文献网络数据的特点,设计了剪枝策略。通过在真实数据上的实验,验证了VSim对搜索语义特征相似实体的适用性,以及VPSim算法的有效性、高执行效率和高可扩展性。(本文来源于《计算机应用》期刊2018年05期)
金运志[10](2017)在《基于本体语义与对象特征的非结构化信息搜索研究》一文中研究指出移动互联网的迅猛发展和移动智能产品的迅速推广,加速了 Web 2.0和社会媒体的发展,导致海量的非结构化信息在互联网上涌现。如何在海量的非结构化信息中有效地、快速地找到所需信息,是信息检索领域一个重要且极具挑战性的研究课题。现有的信息检索系统主要存在两个方面的问题:第一,传统基于关键字的检索利用关键字的绝对匹配技术对文本进行索引和搜索,但由于自然语言固有的歧义性造成检索的查全率与查准率较低,并且搜索返回的结果排序不合理。第二,基于内容的图像检索(CBIR)通过提取图像的视觉特征对图像进行索引和搜索,然而,用户查询意图的高层语义与表达图像的低层视觉特征之间的语义鸿沟严重地影响了 CBIR的性能。为了解决上述问题,尤其是如何对互联网上快速增长的海量信息数据(如文本、图像等)进行有效地分析与高效地搜索,并保证其返回结果的准确性和排序的合理性以及满足用户查询输入来源的多样性,本文对基于本体语义的信息检索相关理论基础进行了研究,在此基础上提出了基于本体语义与对象特征的非结构化信息搜索模式(UISPOSOF)并设计与实现了该模式下的原型系统(UISSOSOF)。具体而言,本文的主要贡献与工作总结如下:(1)提出 了基于 PDCAE(Plan、Do、Check、Act、Evaluate)循环的领域本体构建方法,建立古陶瓷领域本体。针对目前公认的比较成熟的领域本体构建方法(斯坦福大学医学院提出的“七步法”)没有考虑本体评价阶段,从而导致构建出的领域本体的质量参差不齐的现象,本文引入PDCA循环并增加评价阶段,提出基于PDCAE循环的领域本体构建方法使其具有循环、评价反馈等特性,更利于构建高质量的领域本体。在该方法的本体评价阶段,目前已有的综合标准的领域本体评价相关研究未对指标评价集隶属度算法进行讨论,因此,本文给出了领域本体的指标评价集隶属度算法、领域本体评价指标体系和综合评分的计算模型,为定量地评价领域本体的质量或选择集成高质量的领域本体提供参考依据。针对目前古陶瓷领域本体相关研究较少,限制了古陶瓷领域知识的共享与重用以及相关应用的发展,本文建立了古陶瓷领域本体。(2)提出基于本体的语义相似度和相关度计算方法。为了进行语义检索时能够用本体中的概念来表达用户的查询需求,需要计算概念之间的相似度或相关度,判断本体中的概念与用户查询在语义上的匹配程度。针对目前已有的相似度或相关度计算方法未能全面考虑影响概念间相似度或相关度的因素,以及未充分利用本体语义知识的问题,本文提出本体概念间的语义相似度和相关度的计算方法,联合本体概念间的语义相似度与语义相关度的计算方法。基于标准的Miller and Charles测试数据集和WordNet 3.0将提出的计算方法与近年来提出的9种方法进行对比实验,实验结果验证了本文提出的本体概念间的语义相似度计算方法的有效性。(3)提出基于 SVD-SIFT(Singular Value Decomposition-Scale Invariant Feature Transform)的图像重要局部特征提取方法。针对目前基于本体语义的信息搜索研究未考虑联合非结构化信息的特征来对返回的结果进行排序,从而导致基于本体语义的信息搜索不能区分用户查询输入描述非结构化信息语义相同的个体。本文研究联合语义概念和个体对应的非结构化信息的特征(即非结构化对象特征)的方法来进行信息搜索,从而解决返回结果多,排序不合理的问题。如何有效地提取非结构化对象的特征正是解决这一问题的关键。在非结构化对象中,对于图像特征提取,本文提出基于SVD-SIFT的图像重要局部特征提取方法,采用不变矩和基于HSV(Hue Saturation Value)空间的颜色直方图提取图像的全局特征,最后联合图像的重要局部特征和全局特征来描述图像。本文采用联合图像的全局特征(包括颜色特征与形状特征)和重要局部特征(即,SVD-SIFT特征)的方法与颜色直方图、不变矩、SIFT、SVD-SIFT四种图像特征提取方法来进行图像检索对比实验。实验结果表明,本文提出的图像特征提取方法显着降低了图像视觉特征相似度计算的复杂度,平衡了基于内容的图像检索的有效性和高效性。为基于本体语义与对象特征的非结构化信息搜索提供原始基础。(4)提出了基于本体语义与对象特征的非结构化信息搜索模式(UISPOSOF)。具体而言,提出了融合本体语义与非结构化对象特征(即,非结构化信息的特征)的相似度计算策略,并分析与说明融合语义分阶段的相似度量策略对大规模非结构化信息检索更为有利。因此,本文提出了基于本体语义与对象特征的非结构化信息搜索流程,该流程中涉及的核心算法包括基于本体概念的语义搜索算法、基于示例图像的语义搜索算法以及融合语义的分阶段交互式搜索算法,为基于本体语义与对象特征的非结构化信息搜索原型系统的实现奠定了理论基础。(5)基于以上理论研究成果,设计与实现了基于本体语义与对象特征的非结构化信息搜索模式下的原型系统(UISSOSOF)。该系统支持基于本体概念、基于示例图像,以及联合本体概念与示例图像的搜索,并具有一定程度的语义推理能力。在UISSOSOF原型系统平台的基础上,用大量真实的古陶瓷个体信息(以文本和图像为主)对本文提出的搜索算法进行全面地分析与评价,包括搜索实例分析、不同查询模式以及不同算法的比较分析与评价。实验结果验证了本文提出的搜索算法具有有效性和高效性,相对于传统基于关键字的搜索和基于内容的图像检索有显着改进,同时也印证了基于本体语义与对象特征的非结构化信息搜索模式的可行性与实用性。(本文来源于《云南大学》期刊2017-09-01)
语义信息特征论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着社交网络用户群体的日益扩大,社交网络中每天产生的数据也越来越多,社交网络中的数据往往存在着噪声性、多样性及语义稀疏性等问题。针对社交网络数据存在的上述问题,本文对社交网络跨媒体时空特性数据的感知获取、社交网络跨媒体数据的语义提取建模,社交网络数据跨媒体语义搜索进行研究,最终实现了基于跨媒体语义特征的在线社交网络国民安全信息搜索系统。论文完成的主要工作如下:(1)在社交网络跨媒体时空特性数据的感知获取方面,针对社交网络数据广泛存在的噪声性、多样性问题,提出了一种社交网络国民安全时空特性数据获取方法。通过建立国民安全关键词词库,对社交网络跨媒体数据进行组织获取,过滤社交网络数据中存在的噪声信息,对社交网络跨媒体有效数据进行存储。通过提取社交网络对象时间信息、空间位置信息、用户状态信息等,对社交网络国民安全跨媒体数据的时空特性进行感知与获取。(2)在社交网络跨媒体数据的语义提取建模方面,针对社交网络数据存在模态形式多样以及语义稀疏性的特点,提出了基于时空主题词嵌入的文本语义建模算法(STTE)和时空跨媒体语义关联建模算法(STECM)。对于社交网络中的文本数据,结合数据的时空特性,对文本的时间信息和地理空间信息进行建模,通过结合语料数据中的全局和局部上下文信息,充分挖掘文本上下文之间的关联,获得最准确的特征,与传统的主题概率模型相比分类准确率提高了12.7%,与传统词嵌入模型相比分类准确率提高了9.2%。对于社交网络中的图像数据,通过卷积神经网络提取图像的深度特征,对图像数据的视觉特征进行抽象学习,获得图像的深度特征表示,并使用跨模态关联映射函数建立跨媒体数据间的语义映射关系,关联后的跨模态特征在社交网络国民安全数据上的分类性能提高了6.9%。(3)在社交网络数据跨媒体语义搜索方面,针对社交网络数据的多样性和噪声性问题,提出了基于深度随机游走的跨媒体语义关联映射算法(DWM),通过挖掘社交网络数据间的深度语义关联,实现了跨媒体语义关联映射。提出了基于语义扩展和深度哈希网络的社交网络跨媒体搜索算法(DHCS)。结合语义信息扩展和哈希编码,在社交网络跨模态搜索场景下,MAP指标与传统跨媒体空间搜索算法相比提高了13.1%,PR曲线指标相比对比算法提高了21.2%。(4)设计并实现了基于跨媒体语义特征的在线社交网络国民安全信息搜索系统。系统包括社交网络国民安全数据感知获取模块、社交网络国民安全数据特征提取建模模块,以及社交网络国民安全数据跨媒体语义空间搜索模块,实现了社交网络跨媒体国民安全信息的搜索。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语义信息特征论文参考文献
[1].徐里萍,侯玲,张建欣,赵丽.利用改进型语义特征的Web商品信息挖掘方法[J].信息技术.2019
[2].杨从先.基于跨媒体语义特征的在线社交网络国民安全信息搜索研究[D].北京邮电大学.2019
[3].马语丹.结合实体共现信息与句子语义特征的关系抽取[D].北京交通大学.2019
[4].张稼,陆兴华.基于语义关联特征的大型信息管理系统数据挖掘技术[J].电子测量技术.2019
[5].马语丹,赵义,金婧,万怀宇.结合实体共现信息与句子语义特征的关系抽取方法[J].中国科学:信息科学.2018
[6].戴婷婷.从nothing的语义特征看比较句式的信息结构[J].海外英语.2018
[7].李远杰.基于素描信息和贝叶斯网络特征学习的SAR图像语义分割[D].西安电子科技大学.2018
[8].万福成,马宁,何向真.融合事件特征及语义角色标注的藏文信息抽取技术[J].广西师范大学学报(自然科学版).2018
[9].邱庆羽,李婧,全兵,童超,张利君.基于文献信息网络语义特征的相似性搜索[J].计算机应用.2018
[10].金运志.基于本体语义与对象特征的非结构化信息搜索研究[D].云南大学.2017