数据库搜索方法论文-陈福洪

数据库搜索方法论文-陈福洪

导读:本文包含了数据库搜索方法论文开题报告文献综述及选题提纲参考文献,主要关键词:图编辑距离,不确定图数据库,图相似搜索,下界

数据库搜索方法论文文献综述

陈福洪[1](2017)在《不确定图数据库中的图相似搜索方法研究》一文中研究指出在各种现实应用中许多数据都可以用图来表示,关于图形数据模型的研究已经变的越来越广泛。图形数据的日益普及也需要高效的图形数据管理技术,已经有越来越多的研究来寻找有效的方法来解决图相似搜索的问题,比如在生物学、社交网络分析、化学等领域等,在这些领域当中图相似搜索都得到了广泛的应用。但是在这些研究工作当中,都是假设图是确定的。然而,在现实应用当中,由于一些因素的影响和各种其它干扰,图形数据往往都存在着不确定性,它们是变化的。例如在数据提取中的误差,还有集成数据中的不一致性,可能还有一些处于隐私保护的目的等。因此,在本文当中研究不确定图数据库中的图相似搜索问题。在以往的研究中都假设认为图形数据中的边是可变的并且独立于彼此的,但是在本文中假设所有的边是否存在,其彼此之间是存在联系的。有关于图相似搜索问题通常是NP-hard的,因此本文提出了过滤-验证的策略来使搜索得以优化。提出了基于编辑距离下界的不确定图相似搜索方法。具体的,首先提出了一个基于分区结构的图编辑距离下界,其具有更强的过滤能力,每个分区结构包括一个根顶点和它所相邻的边,并不包括其它顶点。分区结构的优点在于一步编辑操作,至多只会影响到两个分区结构。其次,在不确定图的相似搜索过程中,提出了基于编辑距离下界的不确定图相似搜索方法,主要包括结构修剪优化过滤、不确定概率修剪优化过滤和验证叁个阶段。在搜索过程中通过计算查询图和不确定图数据库中的图的相似概率进行判断,如果大于等于给定的相似可能性概率阈值,则作为候选者。若小于给定的相似可能性概率阈值,则将其过滤掉。最后,本文通过大量的实验和总结分析证实了本文提出的基于编辑距离下界的不确定图相似搜索方法在解决不确定图数据库的图相似搜索问题具有良好的有效性和效率。(本文来源于《辽宁大学》期刊2017-05-01)

黄燕,海珊一秀[2](2016)在《关系数据库关键词搜索方法的优化研究》一文中研究指出从关系数据关键词搜索应用来看,由于面临多个关系元组的组合,使得搜索效率普遍较低。同时,针对主流的借助于定位关键词对应元组方式来搜索结果,显然实用性不高。为此,在提升索引效率,优化关系数据库查询能力上,提出对元组的预习索引,利用基于模式图的元组连接枚举技术来构建可能的元组连接,并从检索结果紧致性上提出1到m元组连接的预习索引机制,以支撑复杂查询,加快索引效率。(本文来源于《信息系统工程》期刊2016年09期)

曲进[3](2016)在《云平台数据库搜索引擎的实现方法》一文中研究指出如今电子商务信息化得到很大程度提升,尤其在这个网络高度发达的时代,信息的收集和整理显得十分重要,对于电子商务来说,其未来最有可能的业务模式是与搜索服务结合起来。这种业务模式带来的海量信息数据,利用传统的数据库管理模式已经不能满足我们的需求,如今存在的主要不足为信息单点、搜索效率低下,同时搜索准确率得不到有效的保证,进而不能满足互联网搜索的基本需求,这也是现在很多研究人员十分关注的一个话题。为此,本文对云平台数据搜索相关问题展开研究,设计面向云平台数据搜索的基本结构,进而使得数据库的搜索方式应用于HBase系统内,提升整体查询搜索的性能,使得我们对信息搜索的效率大幅度提升。同时,本文还设计了数据的预处理方案,能够简化关系类型数据与HBase分布式数据之间的交互技术和算法。分析基于编辑距离和矢量数据的算法搜索评价机制,利用关键字之间具有相似部分判断用户的类似数据,大大提升用户搜索效率。(本文来源于《科教导刊(下旬)》期刊2016年07期)

葛唯益,宗士强,尹文科[4](2016)在《一种基于预先索引的关系数据库关键词搜索方法》一文中研究指出关系数据库的关键词搜索面临的最大挑战在于满足需求的答案可能来自多个关系的元组的组合。现有主流方法通过定位每个关键词对应的元组并动态发现元组之间的关联来得到搜索结果。然而当数据库规模较大或模式复杂时,这些方法存在搜索效率低的问题;此外,这些方法因只能支持简单的关键词查询而实用性受到限制。为此,提出对元组的组合进行预先索引从而加快搜索,此外还对其索引效率及查询能力进行改进以提高系统的可用性。首先,为了提高搜索和索引效率,提出基于模式图的元组连接枚举技术,该技术利用无环模式图枚举合适的关系连接,将其转换为SQL语句在数据库中执行以得到可能的元组连接;其次,为了保证结果的紧致性,提出了1到m元组连接的预先索引与顺序搜索机制,该机制对元组连接进行由小到大的搜索,并限制所有包含已有结果的元组连接都不再参与搜索;最后,为了支持复杂查询,提出基于域的索引结构,为每个元组连接建立面向不同查询类型的域,通过查找多个域并对结果进行逻辑组合得到最终结果。实验表明,相比于已有技术,本技术具有较快的索引速度与较高的查询效率,并能提供如布尔查询、属性查询等的复杂查询能力。(本文来源于《计算机科学》期刊2016年04期)

林泽琦,赵俊峰,谢冰[5](2016)在《一种基于图数据库的代码结构解析与搜索方法》一文中研究指出软件复用是在软件开发中避免重复劳动的解决方案.在复用一个已有的软件项目时,软件开发人员通常需要理解某些代码元素以及其间的关联关系,称之为代码结构.软件开发人员一般通过浏览软件源代码的方式理解代码结构.由于源代码往往规模较大且结构复杂,理解代码结构通常会耗费大量的时间与精力.因此,将软件开发人员想要理解的代码结构自动、清晰地展示出来是很有帮助的.提出一种基于图数据库的代码结构解析与搜索方法以实现这一目的.这一方法可对软件的代码结构进行解析,并在图数据库中对其进行有效的组织和管理.搜索时,软件开发人员输入自然语言查询语句,该方法中的搜索机制会分析查询语句,并从图数据库中截取出与其相对应的代码结构进行展示.该方法具有高度的可扩展性:不同粒度的结点与多样化的关联关系可以容易地存储进图数据库中,且面向不同搜索目的的代码结构搜索算法亦可以容易地集成进搜索机制中.这一方法已在相应的工具中得到了实现,其有效性在一个商业案例研究中得到了验证.(本文来源于《计算机研究与发展》期刊2016年03期)

尹吉澧,孟佳明,樊盛博,迟浩,刘超[6](2015)在《pLink:基于交联质谱的数据库搜索方法的研究》一文中研究指出交联质谱技术将质谱技术与交联技术相结合,为研究蛋白质的叁维结构与蛋白质间的相互作用提供了新的技术手段。本课题组在已有工作的基础上研发了应用于化学交联技术的二肽交联鉴定软件系统p Link[1],并于2012年发表在Nature Methods期刊上。p Link软件针对高精度数据,深入挖掘交联质谱谱图离子特征,设计实现了整套高效的算法,包括开放式搜索策略、多种打分设计、E-value的计算、假发现率控制,是目前交联鉴定搜索引擎中的佼佼者。在应用范围上,根据交联试剂的不同,交联质谱鉴定可以适用于不同的研究方向,比如对生物体内真实环境的二硫键交联蛋白质的研究。截至2015年7月30日,p Link[1]共有注册下载用户448名,其中国内143,国外305。用户利用pL ink软件在Nature等期刊上发表了一系列重要文章[2-6]。经过两年的发展,本课题组利用一种高效的索引技术和基于半监督学习的多特征重打分方法,改进了原交联蛋白鉴定软件p Link,成功地加速了交联二肽的鉴定过程,并提升了鉴定的精度。新版p Link在交联质谱技术的各个环节上进行了优化,克服了过去的交联鉴定软件存在的一些缺点。一方面,针对大数据库在交联情况下组合爆炸的问题,采用多种索引结构,逐层鉴定两条肽段,大大缩小了候选肽的规模,在保证精度的同时极大地提高了鉴定速度,多个数据集测试后都有至少10倍以上的加速。另一方面,设计了基于线性支持向量机的多特征机器学习打分系统,并采用分开过滤策略,提高了交联谱图鉴定率。(本文来源于《中国化学会第二届全国质谱分析学术报告会会议摘要集》期刊2015-10-16)

孙靖[7](2014)在《基于云平台的数据库搜索引擎实现方法的研究》一文中研究指出随着电子商务信息快速地增长,在日益复杂的网络环境中搜索信息变得越来越重要,电子商务未来发展趋势将是搜索引擎和电子商务的结合。面对海量数据,传统数据库搜索引擎已经无能为力,主要存在叁个问题,一是单点故障问题,二是索引效率问题,叁是搜索结果准确率问题,很难满足应用要求,如何提高系统的性能是亟需解决的问题。针对传统数据库搜索引擎系统的不足,本文开展基于云平台的数据库搜索引擎实现方法的研究。首先,提出基于云平台的数据库搜索引擎体系结构,使现有的数据库搜索引擎系统在HBase分布式数据库中得到实现,以提高了索引和搜索效率;其次,提出新的数据预处理方法,改进了关系型数据库和HBase分布式数据库之间的数据交互技术,简化了项目开发的框架;接着,提出基于Levenshtein Distance矢量距离算法的搜索评分机制,通过计算关键字间的相似度来判定用户注册重复数据,提高搜索结果的准确率。最后,在电商公司BI部门,实现了基于云平台的数据库搜索引擎的原型系统。测试结果表明,本文提出的系统具有更好的准确性、高效性和扩展性。本文的研究成果在云计算、数据库搜索引擎及其应用领域具有一定的理论价值和很好的应用前景。(本文来源于《南京邮电大学》期刊2014-02-01)

徐国天[8](2013)在《Oracle数据库全库自动搜索方法研究》一文中研究指出Oracle数据库管理的数据量非常庞大,从海量数据中搜索特定数据信息是数据库检验的一项重要工作,因此研究高效、准确的Oracle数据库自动搜索方法对公安机关的调查、取证工作有重要意义。文章深入分析了Oracle数据库与自动搜索方法密切相关的叁个核心系统表(即USER$、OBJ$、COL$)之间的内在联系;详细介绍了数据库自动搜索方法的设计思想和使用步骤,结论是应用文中设计的Oracle数据库自动搜索方法可以准确命中海量数据中的待查记录,提高工作效率。(本文来源于《信息网络安全》期刊2013年05期)

王远敏[9](2011)在《图像数据库建立与相似性搜索方法研究》一文中研究指出图像数据库是使用数据库管理系统来处理目前出现的大量图像数据,好的图像数据库能够适中地将图像的多个属性进行分类存储,同时为图像数据的搜索提供精确的匹配字段。本文研究了图像数据的特点、图像数据库的建立、同时将现有文件管理工具与多特征够成特征法相结合对图像数据进行相似性搜索。(本文来源于《信息与电脑(理论版)》期刊2011年10期)

黄晓梅,王浩[10](2008)在《千万级FTP搜索引擎数据库索引的设计方法探讨》一文中研究指出本文介绍了基于LINUX操作系统的千万级FTP搜索引擎(Sparrow Search)的框架结构,着重探讨了数据库索引的设计方法,针对提高索引检索效率和压缩比率的问题,本文提出了具体方案并给出了实验结果。(本文来源于《考试周刊》期刊2008年11期)

数据库搜索方法论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

从关系数据关键词搜索应用来看,由于面临多个关系元组的组合,使得搜索效率普遍较低。同时,针对主流的借助于定位关键词对应元组方式来搜索结果,显然实用性不高。为此,在提升索引效率,优化关系数据库查询能力上,提出对元组的预习索引,利用基于模式图的元组连接枚举技术来构建可能的元组连接,并从检索结果紧致性上提出1到m元组连接的预习索引机制,以支撑复杂查询,加快索引效率。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

数据库搜索方法论文参考文献

[1].陈福洪.不确定图数据库中的图相似搜索方法研究[D].辽宁大学.2017

[2].黄燕,海珊一秀.关系数据库关键词搜索方法的优化研究[J].信息系统工程.2016

[3].曲进.云平台数据库搜索引擎的实现方法[J].科教导刊(下旬).2016

[4].葛唯益,宗士强,尹文科.一种基于预先索引的关系数据库关键词搜索方法[J].计算机科学.2016

[5].林泽琦,赵俊峰,谢冰.一种基于图数据库的代码结构解析与搜索方法[J].计算机研究与发展.2016

[6].尹吉澧,孟佳明,樊盛博,迟浩,刘超.pLink:基于交联质谱的数据库搜索方法的研究[C].中国化学会第二届全国质谱分析学术报告会会议摘要集.2015

[7].孙靖.基于云平台的数据库搜索引擎实现方法的研究[D].南京邮电大学.2014

[8].徐国天.Oracle数据库全库自动搜索方法研究[J].信息网络安全.2013

[9].王远敏.图像数据库建立与相似性搜索方法研究[J].信息与电脑(理论版).2011

[10].黄晓梅,王浩.千万级FTP搜索引擎数据库索引的设计方法探讨[J].考试周刊.2008

标签:;  ;  ;  ;  

数据库搜索方法论文-陈福洪
下载Doc文档

猜你喜欢