语义层次结构论文-应学凤

语义层次结构论文-应学凤

导读:本文包含了语义层次结构论文开题报告文献综述及选题提纲参考文献,主要关键词:动宾倒置复合词,层次结构,韵律与语义,原生式和附加式

语义层次结构论文文献综述

应学凤[1](2019)在《韵律与语义互动视角下的动宾倒置复合词的层次结构》一文中研究指出动宾倒置复合词底层的层次结构是[[OV]N],表层层次结构有的是[O[VN]],有的是[[OV]N],有些两可现象是韵律与语义互动的结果。动宾倒置复合词有原生式和附加式。原生式是基本的,底层是[[OV]N],在"自然音步"等韵律制约下,既可切分为[O[VN]],又可切分为[[OV]N]。在"N"是否为单音节黏着语素、"N"是否为"V"的论元、"VN"是否常见或有歧义等语义因素制约下,有的只能切分为[O[VN]],有的只能切分为[[OV]N]。(本文来源于《汉语学习》期刊2019年04期)

涂鼎[2](2016)在《基于层次语义结构的流式文本数据挖掘》一文中研究指出文本作为一种人类信息交流的基本方式,在非结构化数据中占有极其重要的地位。与其他形式的数据相比,文本数据通常价值较高,因而对文本数据自动分析和挖掘方法的研究一直是计算机领域的一个热门话题。目前互联网上的文本数据增长十分迅速,且是每时每刻持续不断生成的,因此可将其看作是一条条连续的文本流。与传统文本数据相比,流式文本数据具有一些新的特点:1)文本流中的很多数据是低质量的,较难提取有效语义信息;2)文本流中的模式是动态变化的,对挖掘技术提出了准确捕捉这种变化的要求。以上这些特点对现有文本数据挖掘技术提出了新的挑战。目前流式文本数据挖掘技术尚未十分完善,急需提出针对以上挑战的相关算法。层次结构作为常见的数据组织方式,不仅能够更加精确的反映数据间的固有关系,并且是实现自适应方法的一种重要途径,而基于自适应方法可实现自动匹配流式数据中不断变化的模式。本文将层次结构应用到流式文本数据挖掘中,从概念层次构建、稀有类别检测和在线主题检测等叁方面入手,提出了叁种方法以期提高流式文本数据挖掘的性能。最后基于上述方法,本文提出了一种针对流式文本数据挖掘的半监督在线层次主题模型。本文具体贡献如下:1)针对现有概念层次构建方法在微博、用户评论等不规范短文本中语义关系提取精度较低的问题,提出了一种基于复合语义距离的多路概念层次构建方法。该方法中的复合语义距离结合了语义字典距离和上下文距离的优点,并且保证了方法的适用范围和所获取的语义关系的精度。同时,本文还提出一种改进的多路凝聚聚类算法用以构建概念层次。相对传统凝聚聚类而言,多路凝聚聚类能保持概念对间的相对远近关系。此外,本文还提出一种改进的概念层次相似度标准,该标准解决了其原始形式中可能出现的多次匹配问题。实验结果表明,该方法生成的概念层次与真实概念层次的相似度为所有对比方法中最高。2)针对从文本流的概念层次或主题层次中发现新概念或主题的问题,提出了一种基于层次密度聚类的稀有类别检测方法。在社交网络或新闻流中,发现新颖的文档或者新兴主题是很有价值的,异常检测在新颖数据检测中可发挥关键作用。为了改进现有检测方法,本文首先提出了一种基于相对距离约束和核函数的半监督密度聚类算法(Relative Comparison Kernel Mean Shift,RKMS)。与其原始形式相比,RKMS可扩展性更强,且更加适合层次聚类这种应用场景。然后本文基于RKMS提出了一种基于层次结构的稀有类别检测方法。与现有同类方法相比,该方法的优点是无需预先指定类别的数目,且可通过结合主动学习和半监督学习实现模型的逐步优化。实验结果表明,该稀有类别检测方法在使用线性映射和非线性映射的情况下均比其他方法表现更好。3)针对从持续输入的文本流中检测和跟踪主题的问题,提出了一种在线的层次主题模型(Hierarchical Online Non-negative Matrix Factorization,HONMF)。现有在线主题模型大多以扁平方式组织已发现的主题,但将每个主题视作互相独立的个体忽略了主题间的潜在关系,因而限制了这些主题模型的表达能力。针对该问题,本文首先对在线字典学习方法进行扩展并提出一种层次的在线稀疏矩阵分解方法,其可生成以层次形式组织的主题。同时,本文借鉴均值漂移(Mean Shift)聚类的思想提出一种基于主题带宽(Topic Bandwidth)的主题层次结构控制机制,其可自适应的决定主题节点的数目和主题层次的深度。此外,本文还提出在已有主题层次中检测新兴主题和消亡主题的标准,并基于这些标准实现主题层次结构的动态演化。实验结果表明,HONMF能够在更短的运行时间内发现更高质量的主题,并且可跟踪主题结构的变化。4)为了验证本文研究路线的整体效果和进一步提升HONMF的性能,提出了一种基于语义关系的半监督层次在线主题检测框架(Semantic Relation based Semi-supervised Hierarchical Online Non-negative Matrix Factorization,SSHONMF),其将本文前述研究工作整合融合到一套流程中。该流程首先根据语义词典和训练文档生成针对特定文本挖掘任务的概念层次,并基于其中的语义关系对原始文档矩阵进行调整。接着其会使用HONMF检测文本流中的主题层次,同时基于本文稀有类别检测方法中的选择指标从主题层次中选择出线索文档。最后,其将根据线索文档学习出新的相似度度量并用于后续的HONMF过程。实验结果表明,通过结合前述方法,SSHONMF的性能比HONMF有所提升,证明了本文研究路线的合理性和有效性。(本文来源于《浙江大学》期刊2016-04-01)

史瑞芳[3](2015)在《自动获取HTML表格语义层次结构的方法》一文中研究指出当前国内的Web信息集成技术在发展中遇到较大的瓶颈,现有的集成技术还无法处理结构相对较为复杂的信息表格以及嵌套信息表格等,严重阻碍了国内各行业的发展。而自动搜集HTML语义结构法可以解决目前集成技术所面临的难点,并且这种处理表格的技术可以通过内容树从而直观的展示语义结构。因此,本文重点对自动获取法的运行原理以及处理形式进行阐述。(本文来源于《电子技术与软件工程》期刊2015年22期)

卢晓帆,王强,王瑛,张兵[4](2014)在《基于层次分析和二元语义的飞机结构安全评价研究》一文中研究指出针对当前飞机结构的设计要求,建立了飞机结构安全的评价模型指标集,利用AHP方法提炼出4大类,14项具体指标,并确定指标权重,采用二元语义及其算子将评价语言值进行集结,对飞机结构安全进行评价.给出了评价步骤,并用实例说明该方法具有一定的可操作性,且合理可信.(本文来源于《数学的实践与认识》期刊2014年04期)

王景中,曲泷玉[5](2013)在《基于层次结构语义框架的文本过滤研究》一文中研究指出文章提出了一种基于层次结构语义框架的信息过滤匹配算法,用以进行网络文本过滤。文章将网页分为两层,即标题层与正文层,标题层比正文层的权重大。该算法综合考虑3种因素,即"槽"与行为动词之间的语义距离、"槽"的相关度与层级结构,并进行权重的计算与归一化。试验结果表明,与传统算法相比较,该算法可以使文本的查全率和查准率得到一定程度的提高。(本文来源于《信息网络安全》期刊2013年11期)

童敏,王英伟[6](2012)在《一种基于结构化层次匹配操作的语义Web服务发现方法》一文中研究指出网络服务发现的过程是匹配的服务请求与广告服务,检索相关服务请求。服务发现过程可以更有效的利用语义规格的服务。OWL-S提供标准语义指定的服务,在服务的发现可以通过能力匹配。考虑到结构层次匹配操作,在控制流组件可以用来发现过程更可靠。在本文中我们提出匹配标准结合的能力匹配和结构层次匹配。服务分类的基础上的能力,是为能力匹配和结构层次匹配的基础上进行结构的业务服务。(本文来源于《计算机光盘软件与应用》期刊2012年21期)

徐泉清,代亚非,崔斌[7](2010)在《一种无结构P2P系统中基于层次兴趣树的语义检索机制》一文中研究指出提出了一种无结构P2P系统中有效的语义检索方法:基于层次兴趣树(HIT)的语义检索。每个节点中所有的文档根据分类目录被分类成层次兴趣树,并发送至该节点所属的超级节点。同时,每个类中前n个关键词的倒排文档索引,也会依据它们的χ2统计值被发送至超级节点。当节点发送一个查询并给出类别语义相似性阈值Simth时,查询消息通过一个有效的查询路由算法被转发,结果则通过搜索HIT返回。不同的节点可以给出各自不同的Simth,其灵活性可以为每个节点提供更好的个性化服务。实验表明在无结构的P2P系统中,基于HIT的语义检索方法比以前的方法具有更好的准确性和有效性。(本文来源于《北京大学学报(自然科学版)》期刊2010年01期)

于婧,张建辉,顾小卓,汪斌强[8](2008)在《基于主题和物理位置相近原则的层次化对等语义覆盖网络结构》一文中研究指出对等语义覆盖网络构建主要采用索引和超级节点的方法,不可避免地存在瓶颈问题,同时忽略了覆盖网络与实际网络拓扑一致性问题对语义覆盖网络性能的重要影响。该文提出的对等语义覆盖网络结构TPPH充分结合了结构化P2P网络高效的定位和非结构化P2P网络的复杂检索功能,采用分布式哈希表机制将相同主题节点组织成主题区域,在同一主题区域内通过物理位置相近原则进行群的划分,从而在物理网络拓扑基础上建立语义P2P覆盖网络结构。性能分析和仿真实验表明,该结构显着提高了查全率并缩短了平均查询时延,是一种支持复杂查询、高性能的语义覆盖网络结构。(本文来源于《电子与信息学报》期刊2008年08期)

范莉娅,肖田元[9](2007)在《自动获取HTML表格语义层次结构方法》一文中研究指出针对目前方法不能处理复杂表格或嵌套表格等缺点,提出了自动获取超文本标记语言(HTML)表格的语义层次结构的方法。该方法以表格的4种基本类型为基础,使用内容树表示表格的语义层次结构。方法主要包含3个步骤:识别HTML表格的属性单元格和值单元格;将表格拆分为基本表格;为拆分后的基本表格构造内容树,获取表格的语义层次结构。实验结果证明该方法能自动处理嵌套表格和复杂表格,复杂性不高,精度较好。(本文来源于《清华大学学报(自然科学版)》期刊2007年10期)

李长云,廖立君,金可音[10](2006)在《软件体系结构的层次语义分析》一文中研究指出软件体系结构设计具有层次性,不同层次软件体系结构抽象级别不一样,相邻两层的软件体系结构存在着确定的转换关系。从拓扑关系和计算关系的视角分析了软件体系结构的层次语义,说明了相邻层的软件体系结构具有因果连接关系,上层是下层的抽象、约束,下层是上层的具体化、解释。(本文来源于《计算机工程》期刊2006年01期)

语义层次结构论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

文本作为一种人类信息交流的基本方式,在非结构化数据中占有极其重要的地位。与其他形式的数据相比,文本数据通常价值较高,因而对文本数据自动分析和挖掘方法的研究一直是计算机领域的一个热门话题。目前互联网上的文本数据增长十分迅速,且是每时每刻持续不断生成的,因此可将其看作是一条条连续的文本流。与传统文本数据相比,流式文本数据具有一些新的特点:1)文本流中的很多数据是低质量的,较难提取有效语义信息;2)文本流中的模式是动态变化的,对挖掘技术提出了准确捕捉这种变化的要求。以上这些特点对现有文本数据挖掘技术提出了新的挑战。目前流式文本数据挖掘技术尚未十分完善,急需提出针对以上挑战的相关算法。层次结构作为常见的数据组织方式,不仅能够更加精确的反映数据间的固有关系,并且是实现自适应方法的一种重要途径,而基于自适应方法可实现自动匹配流式数据中不断变化的模式。本文将层次结构应用到流式文本数据挖掘中,从概念层次构建、稀有类别检测和在线主题检测等叁方面入手,提出了叁种方法以期提高流式文本数据挖掘的性能。最后基于上述方法,本文提出了一种针对流式文本数据挖掘的半监督在线层次主题模型。本文具体贡献如下:1)针对现有概念层次构建方法在微博、用户评论等不规范短文本中语义关系提取精度较低的问题,提出了一种基于复合语义距离的多路概念层次构建方法。该方法中的复合语义距离结合了语义字典距离和上下文距离的优点,并且保证了方法的适用范围和所获取的语义关系的精度。同时,本文还提出一种改进的多路凝聚聚类算法用以构建概念层次。相对传统凝聚聚类而言,多路凝聚聚类能保持概念对间的相对远近关系。此外,本文还提出一种改进的概念层次相似度标准,该标准解决了其原始形式中可能出现的多次匹配问题。实验结果表明,该方法生成的概念层次与真实概念层次的相似度为所有对比方法中最高。2)针对从文本流的概念层次或主题层次中发现新概念或主题的问题,提出了一种基于层次密度聚类的稀有类别检测方法。在社交网络或新闻流中,发现新颖的文档或者新兴主题是很有价值的,异常检测在新颖数据检测中可发挥关键作用。为了改进现有检测方法,本文首先提出了一种基于相对距离约束和核函数的半监督密度聚类算法(Relative Comparison Kernel Mean Shift,RKMS)。与其原始形式相比,RKMS可扩展性更强,且更加适合层次聚类这种应用场景。然后本文基于RKMS提出了一种基于层次结构的稀有类别检测方法。与现有同类方法相比,该方法的优点是无需预先指定类别的数目,且可通过结合主动学习和半监督学习实现模型的逐步优化。实验结果表明,该稀有类别检测方法在使用线性映射和非线性映射的情况下均比其他方法表现更好。3)针对从持续输入的文本流中检测和跟踪主题的问题,提出了一种在线的层次主题模型(Hierarchical Online Non-negative Matrix Factorization,HONMF)。现有在线主题模型大多以扁平方式组织已发现的主题,但将每个主题视作互相独立的个体忽略了主题间的潜在关系,因而限制了这些主题模型的表达能力。针对该问题,本文首先对在线字典学习方法进行扩展并提出一种层次的在线稀疏矩阵分解方法,其可生成以层次形式组织的主题。同时,本文借鉴均值漂移(Mean Shift)聚类的思想提出一种基于主题带宽(Topic Bandwidth)的主题层次结构控制机制,其可自适应的决定主题节点的数目和主题层次的深度。此外,本文还提出在已有主题层次中检测新兴主题和消亡主题的标准,并基于这些标准实现主题层次结构的动态演化。实验结果表明,HONMF能够在更短的运行时间内发现更高质量的主题,并且可跟踪主题结构的变化。4)为了验证本文研究路线的整体效果和进一步提升HONMF的性能,提出了一种基于语义关系的半监督层次在线主题检测框架(Semantic Relation based Semi-supervised Hierarchical Online Non-negative Matrix Factorization,SSHONMF),其将本文前述研究工作整合融合到一套流程中。该流程首先根据语义词典和训练文档生成针对特定文本挖掘任务的概念层次,并基于其中的语义关系对原始文档矩阵进行调整。接着其会使用HONMF检测文本流中的主题层次,同时基于本文稀有类别检测方法中的选择指标从主题层次中选择出线索文档。最后,其将根据线索文档学习出新的相似度度量并用于后续的HONMF过程。实验结果表明,通过结合前述方法,SSHONMF的性能比HONMF有所提升,证明了本文研究路线的合理性和有效性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

语义层次结构论文参考文献

[1].应学凤.韵律与语义互动视角下的动宾倒置复合词的层次结构[J].汉语学习.2019

[2].涂鼎.基于层次语义结构的流式文本数据挖掘[D].浙江大学.2016

[3].史瑞芳.自动获取HTML表格语义层次结构的方法[J].电子技术与软件工程.2015

[4].卢晓帆,王强,王瑛,张兵.基于层次分析和二元语义的飞机结构安全评价研究[J].数学的实践与认识.2014

[5].王景中,曲泷玉.基于层次结构语义框架的文本过滤研究[J].信息网络安全.2013

[6].童敏,王英伟.一种基于结构化层次匹配操作的语义Web服务发现方法[J].计算机光盘软件与应用.2012

[7].徐泉清,代亚非,崔斌.一种无结构P2P系统中基于层次兴趣树的语义检索机制[J].北京大学学报(自然科学版).2010

[8].于婧,张建辉,顾小卓,汪斌强.基于主题和物理位置相近原则的层次化对等语义覆盖网络结构[J].电子与信息学报.2008

[9].范莉娅,肖田元.自动获取HTML表格语义层次结构方法[J].清华大学学报(自然科学版).2007

[10].李长云,廖立君,金可音.软件体系结构的层次语义分析[J].计算机工程.2006

标签:;  ;  ;  ;  

语义层次结构论文-应学凤
下载Doc文档

猜你喜欢