层次相似度论文-朱建林,陈忠阳,张永俊,孙存一

层次相似度论文-朱建林,陈忠阳,张永俊,孙存一

导读:本文包含了层次相似度论文开题报告文献综述及选题提纲参考文献,主要关键词:词类区分度,全路径相似度,大规模层次分类,文本分类

层次相似度论文文献综述

朱建林,陈忠阳,张永俊,孙存一[1](2019)在《基于全路径相似度的大规模层次分类算法》一文中研究指出为快速准确地实现大规模层次分类问题,提出词类区分度概念,并以此作为计算类向量的基础。基于类向量,以改进的Rocchio算法计算待分类文本与目标类的相似度,候选出N个最可能的目标类别;根据目标类别的层次拓扑结构,计算待分类文本与N个目标类别的全路径相似度,确定分类类别。实验结果表明,该方法分类效果优于传统算法,其基于文本类全路径相似度的策略明显改善了单纯基于词类区分度的分类算法。(本文来源于《计算机工程与设计》期刊2019年05期)

王盈辉[2](2017)在《基于属性短内容相似度计算的层次化本体自动扩展》一文中研究指出目前网络上数量庞大的数据信息,大多以HTML页面的形式被展示,由于HTML标记语言自身的特点,现有的大量数据往往不具有良好的组织与结构。另外,还存在多个概念表达同一语义的情况。那么,语义网不但可以将数据的表达形式和内容本身分离开,还通过定义一个领域内的公共本体,对不同概念表达同一语义的情况进行消歧,以实现计算机对数据的直接处理和理解。构建好的本体不应该是一成不变的,它应该随着数据的增加而不断更新扩展。本体的概念层级结构依据概念间的上下位关系对概念进行组织并存储大量的概念实例—实体。因此本体的更新扩展问题涉及到的两个最重要的问题分别是新实体的插入更新与新概念的定义更新。本文我们提出了一个自动化的解决方法来对本体进行更新,该方法可以向本体的概念层级中插入新实体,同时生成新的概念并将其插入概念层级中合适的位置。我们所用的方法仅仅需要有关新实体描述的很有限的信息,例如每一个实体自身所包含的属性。解决方法是综合了概念层级的结构和实体属性的文本内容这两方面的优势而提出的一种策略,其中实体属性的文本内容用来衡量一个实体和一个概念间的相似度,而概念层级的结构用来决定计算实体和哪一个概念间的相似度。我们提出的方法中用到的相似度度量方法,也结合了概率和规则两种因素。为了检验我们提出的方法的实际效果,我们在中文维基百科数据上进行了实验,即向已存在的中文维基百科概念曾经中插入新实体和形成新的概念对其进行扩展。在新实体插入的实验中,大多数情况下我们的方法表现较好,综合策略的表现优于仅仅使用了单一策略的方法。对概念层级第一层和第二层的概念进行新实体插入时,表现最好的实验的准确率都高于0.85。此外,在将新实体插入概念后,我们还基于实体属性和属性值的相似度度量方法,对概念中存在和新实体同名的情况进行区分。在新概念生成的实验中,基于实体属性的聚类方法在大多数情况下也表现良好。(本文来源于《天津大学》期刊2017-11-01)

段晓旗,刘涛,武丹[3](2016)在《基于层次分析法的多尺度点群目标相似度计算》一文中研究指出计算不同尺度下空间目标的相似性是GIS研究的热点问题之一。点群是地理空间群组目标的一种,研究其相似性可对空间群组目标的计算机制图结果进行评价。以往的理论研究主要从影响点群目标的单一因子出发,对影响点群目标的简单因子进行分析,并以此提出相应计算模型。为了研究点群目标在不同尺度下的相似性问题,本文在前人研究的基础上,整合了影响点群目标相似性的主要因子(包括拓扑关系、方向关系、距离关系、分布范围和分布密度),并分别提出拓扑相似度、方向相似度、分布范围相似度、距离相似度分布和密度相似度的计算模型,从整体上把握计算点群目标的相似性。通过层次分析法,赋予5种因子相应的权重,最后集成不同尺度下点群目标相似度的总体计算模型。经过计算验证,该方法能较准确地计算不同尺度下点群目标的相似程度,为制图综合质量做出评价。(本文来源于《地球信息科学学报》期刊2016年10期)

蒋仁龙,蒋子龙[4](2015)在《基于q-gram层次空间的机器翻译中句子相似度计算探析》一文中研究指出机器翻译由于其简易性和速度快而成为一个热门的研究对象,然而其翻译质量低也是一个不争的事实。利用q-gram层次空间和Porter Stemming算法,设计了一种计算句子匹配率的方法,并利用算例进行了详细的阐释,从而给机器翻译及英文文本比较提供了一种思路。实验结果表明,该方法在目前基于规则与实例结合的句子相似度计算方法中是可行的。(本文来源于《遵义师范学院学报》期刊2015年05期)

张豪,陈黎飞,郭躬德[5](2015)在《规范化相似度的符号序列层次聚类》一文中研究指出符号序列由有限个符号按一定顺序排列而成,广泛存在于数据挖掘的许多应用领域,如基因序列、蛋白质序列和语音序列等。作为序列挖掘的一种主要方法,序列聚类分析在识别序列数据内在结构等方面具有重要的应用价值;同时,由于符号序列间相似性度量较为困难,序列聚类也是当前的一项开放性难题。首先提出一种新的符号序列相似度度量,引入长度规范因子解决现有度量对序列长度敏感的问题,从而提高了符号序列相似度度量的有效性。在此基础上,提出一种新的聚类方法,根据样本相似度构建无回路连通图,通过图划分进行符号序列的层次聚类。在多个实际数据集上的实验结果表明,采用规范化度量的新方法可以有效提高符号序列的聚类精度。(本文来源于《计算机科学》期刊2015年05期)

郑睿[6](2015)在《基于HowNet树层次模型的语义相似度计算方法研究》一文中研究指出随着互联网的快速发展和网络资源的日益丰富,从海量文本信息中准确返回用户所需内容的需求越发强烈,人们对计算机处理文本信息的能力要求越来越高。作为文本信息处理和自然语言处理的基础研究内容,语义相似度广泛应用于自动问答系统、基于实例的机器翻译、多文档文摘、信息检索等领域。语义相似度的计算结果直接影响文本信息处理的效果,因此提高语义相似度计算的准确性十分必要。词语是构成句子最基本的语义和语法单位。词语相似度的计算是语义相似度最基本的研究内容,提高词语相似度计算效果能够更好的服务于上层应用研究。本文分析比较主流的词语相似度计算方法,对基于How Net的词语相似度展开研究。在How Net的基本结构和树层次模型的基础上,提出一种改进的基于节点概率密度比的词语相似度计算方法。将改进算法进行实验仿真并与最新算法比较,验证本文提出的算法更接近人工评估的结果。句子是表达一个完整语义的基本结构。句子相似度的计算涉及词法、词义、句法、上下文环境等内容,是一个具有挑战性的问题。针对单一特征的句子相似度计算方法在刻画句子相似度上存在片面性的问题,本文对基于How Net多特征的计算方法开展研究。在How Net丰富的语义和独特的知识表达结构的基础上,综合词形特征、词义特征和句法特征,提出一种改进的基于词语权重的多特征句子相似度计算方法。将改进算法进行实验仿真并与原先算法比较,实验结果表明本文提出的算法效果有所提高。(本文来源于《湖南大学》期刊2015-05-06)

康顺,李佳田[7](2013)在《基于层次Voronoi图的点群相似度算法》一文中研究指出通过对空间点群的自适应聚类方法构建层次Voronoi图,以此层次Voronoi图为切入点,计算点群的拓扑、密度和范围的相似度,结合有关标准差的数理统计方法,计算角度、距离的相似度。在各维度的相似度基础上,使用其几何平均值作为点群整体相似度的度量标准,优化点群相似度的计算方法,并通过实验证明算法的可行性。(本文来源于《计算机应用》期刊2013年10期)

徐静,陈夏露,何忠秀[8](2010)在《本体领域内产品层次结构的相似度计算》一文中研究指出本体领域内的产品种类数量繁多,如何有效地进行归类、查询是一个难以实施的问题。本文在使用层次结构表示领域内产品后,设计算法来计算领域内各产品间的相似度,为产品的归类、查询、用户产品推荐,甚至用户浏览行为的分析等提供依据。(本文来源于《计算机与现代化》期刊2010年11期)

孙霞,程宏斌[9](2009)在《基于加权层次结构的XML文档相似度算法》一文中研究指出提出了一种基于加权层次结构的XML文档相似度算法。根据XML文档的层次结构信息,该算法能够快速的进行文档相似度的计算,并识别出具有相同结构的XML文档,实验表明该算法有效降低了解决问题的复杂度。该算法还可以用于XML文档聚类、XML文档结构抽取、XML文档的变换检测等方面,具有较好的普遍适用性。(本文来源于《武汉理工大学学报》期刊2009年18期)

黄宏斌,刘志忠,张维明,邓苏,马丽丽[10](2009)在《基于层次本体模型(HOM)的语义相似度计算方法》一文中研究指出本体映射通过计算实体之间的局部的或/和全局的语义相似度来确定实体之间的关系。除了实体之间的局部或/和全局的关系外,在很多情况下整个本体之间的关系对于计算语义相似度也是很有帮助的。本文试图利用这些关系来计算实体之间的相似度以改进本体映射的性能。为此,本文以范畴论为基础提出了一个层次化的本体模型(hierarchical ontology model,HOM)用以形式化描述这种关系。在此基础上,还提出了一种本体映射算法HOM-Matching,该算法利用本体之间的关系来计算实体之间的语义相似度。两组实验表明:通过设定合适的参数,该算法可以较好地提高本体映射的性能。(本文来源于《系统工程与电子技术》期刊2009年07期)

层次相似度论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

目前网络上数量庞大的数据信息,大多以HTML页面的形式被展示,由于HTML标记语言自身的特点,现有的大量数据往往不具有良好的组织与结构。另外,还存在多个概念表达同一语义的情况。那么,语义网不但可以将数据的表达形式和内容本身分离开,还通过定义一个领域内的公共本体,对不同概念表达同一语义的情况进行消歧,以实现计算机对数据的直接处理和理解。构建好的本体不应该是一成不变的,它应该随着数据的增加而不断更新扩展。本体的概念层级结构依据概念间的上下位关系对概念进行组织并存储大量的概念实例—实体。因此本体的更新扩展问题涉及到的两个最重要的问题分别是新实体的插入更新与新概念的定义更新。本文我们提出了一个自动化的解决方法来对本体进行更新,该方法可以向本体的概念层级中插入新实体,同时生成新的概念并将其插入概念层级中合适的位置。我们所用的方法仅仅需要有关新实体描述的很有限的信息,例如每一个实体自身所包含的属性。解决方法是综合了概念层级的结构和实体属性的文本内容这两方面的优势而提出的一种策略,其中实体属性的文本内容用来衡量一个实体和一个概念间的相似度,而概念层级的结构用来决定计算实体和哪一个概念间的相似度。我们提出的方法中用到的相似度度量方法,也结合了概率和规则两种因素。为了检验我们提出的方法的实际效果,我们在中文维基百科数据上进行了实验,即向已存在的中文维基百科概念曾经中插入新实体和形成新的概念对其进行扩展。在新实体插入的实验中,大多数情况下我们的方法表现较好,综合策略的表现优于仅仅使用了单一策略的方法。对概念层级第一层和第二层的概念进行新实体插入时,表现最好的实验的准确率都高于0.85。此外,在将新实体插入概念后,我们还基于实体属性和属性值的相似度度量方法,对概念中存在和新实体同名的情况进行区分。在新概念生成的实验中,基于实体属性的聚类方法在大多数情况下也表现良好。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

层次相似度论文参考文献

[1].朱建林,陈忠阳,张永俊,孙存一.基于全路径相似度的大规模层次分类算法[J].计算机工程与设计.2019

[2].王盈辉.基于属性短内容相似度计算的层次化本体自动扩展[D].天津大学.2017

[3].段晓旗,刘涛,武丹.基于层次分析法的多尺度点群目标相似度计算[J].地球信息科学学报.2016

[4].蒋仁龙,蒋子龙.基于q-gram层次空间的机器翻译中句子相似度计算探析[J].遵义师范学院学报.2015

[5].张豪,陈黎飞,郭躬德.规范化相似度的符号序列层次聚类[J].计算机科学.2015

[6].郑睿.基于HowNet树层次模型的语义相似度计算方法研究[D].湖南大学.2015

[7].康顺,李佳田.基于层次Voronoi图的点群相似度算法[J].计算机应用.2013

[8].徐静,陈夏露,何忠秀.本体领域内产品层次结构的相似度计算[J].计算机与现代化.2010

[9].孙霞,程宏斌.基于加权层次结构的XML文档相似度算法[J].武汉理工大学学报.2009

[10].黄宏斌,刘志忠,张维明,邓苏,马丽丽.基于层次本体模型(HOM)的语义相似度计算方法[J].系统工程与电子技术.2009

标签:;  ;  ;  ;  

层次相似度论文-朱建林,陈忠阳,张永俊,孙存一
下载Doc文档

猜你喜欢