导读:本文包含了文档图论文开题报告文献综述及选题提纲参考文献,主要关键词:结构相似性,广度优先搜索算法,可扩展标记语言,文档图
文档图论文文献综述
张杰,卫金茂,刘丹[1](2008)在《基于BFS树的XML文档图结构相似性计算》一文中研究指出可扩展链接语言将XML文档从树状结构扩展到图状结构,其结构相似性比较对文档查询、聚类意义重大。现存的比较XML树状结构相似性以及比较图结构相似性的方法忽视了文档结构特点,比较的结果与实际存在较大差异。基于BFS树的XML文档图结构相似性计算方法运用广度优先搜索算法找到最小代码树,重新定义了编辑距离的概念。比较结果表明,该方法更符合实际文档相似程度,因此在比较XML文档图结构相似性上有很大的可行性。(本文来源于《计算机工程与设计》期刊2008年17期)
张杰[2](2008)在《XML文档图结构相似性计算》一文中研究指出XML(Extensive Markup Language可扩展标志语言)是W3C机构继HTML之后提出的又一超文本标记语言。越来越多的网上信息交换都依附于这种形式,许多软件需要检索、存取、处理相关条件的XML文档并且返回近似值,因此XML文档的相似性评价受到越来越多的关注。XML文档本身并不是简单的树状结构,它通过XLL(Extensible Link Language可扩展链接语言)可完成所有典型的超文本链接,也就是说,随着XML描述能力的不断扩大,不能将XML文档简单的描述为树状结构,而是XML文档图,其结构相似性比较对文档查询、聚类意义重大。现有的比较XML树状结构相似性以及比较图结构相似性的方法忽视了文档结构特点,比较的结果与实际存在较大差异。本文针对这一问题,提出了一种XML文档图结构相似性计算的方法,将文档中的链接写入文档结构,基于文档图比较结构相似性。为此,本文从以下几个方面进行研究和探讨:首先,本文介绍了XML文档的概念、特点及应用领域,分析了XML文档图的描述形式,存在的客观必然性,以及结构相似性的广泛应用。其次,本文在介绍了现有的比较文档结构相似性的几种方法后,提出了一种比较方法,从文档本身的图形结构出发,通过将图转化为树来设置相应结点和边的权重、完成代价转换,描绘文档图的结构相似性。然后,本文通过举例分析说明了本方法的可行性:1.结点之间关联的变化能通过相似度值得到体现;2.从邻接矩阵找到关联最多的结点作为根结点,确定可作为根的结点的位置和个数;3.从根结点开始确定树形结构以赋予边和结点相应的权重,为后续操作代价的计算提供依据;4.通过矩阵转换,完成结点和边的添加删除操作,以及由此产生的代价;5.运用本文提出的公式计算文档相似度值;最后,本文将该算法与其他算法进行对比,说明该方法更符合人们的判断标准,更能真实的反映两XML文档图的相似程度,并提出完善本算法的进一步打算。(本文来源于《东北师范大学》期刊2008-06-01)
文档图论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
XML(Extensive Markup Language可扩展标志语言)是W3C机构继HTML之后提出的又一超文本标记语言。越来越多的网上信息交换都依附于这种形式,许多软件需要检索、存取、处理相关条件的XML文档并且返回近似值,因此XML文档的相似性评价受到越来越多的关注。XML文档本身并不是简单的树状结构,它通过XLL(Extensible Link Language可扩展链接语言)可完成所有典型的超文本链接,也就是说,随着XML描述能力的不断扩大,不能将XML文档简单的描述为树状结构,而是XML文档图,其结构相似性比较对文档查询、聚类意义重大。现有的比较XML树状结构相似性以及比较图结构相似性的方法忽视了文档结构特点,比较的结果与实际存在较大差异。本文针对这一问题,提出了一种XML文档图结构相似性计算的方法,将文档中的链接写入文档结构,基于文档图比较结构相似性。为此,本文从以下几个方面进行研究和探讨:首先,本文介绍了XML文档的概念、特点及应用领域,分析了XML文档图的描述形式,存在的客观必然性,以及结构相似性的广泛应用。其次,本文在介绍了现有的比较文档结构相似性的几种方法后,提出了一种比较方法,从文档本身的图形结构出发,通过将图转化为树来设置相应结点和边的权重、完成代价转换,描绘文档图的结构相似性。然后,本文通过举例分析说明了本方法的可行性:1.结点之间关联的变化能通过相似度值得到体现;2.从邻接矩阵找到关联最多的结点作为根结点,确定可作为根的结点的位置和个数;3.从根结点开始确定树形结构以赋予边和结点相应的权重,为后续操作代价的计算提供依据;4.通过矩阵转换,完成结点和边的添加删除操作,以及由此产生的代价;5.运用本文提出的公式计算文档相似度值;最后,本文将该算法与其他算法进行对比,说明该方法更符合人们的判断标准,更能真实的反映两XML文档图的相似程度,并提出完善本算法的进一步打算。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
文档图论文参考文献
[1].张杰,卫金茂,刘丹.基于BFS树的XML文档图结构相似性计算[J].计算机工程与设计.2008
[2].张杰.XML文档图结构相似性计算[D].东北师范大学.2008