导读:本文包含了数据集检索论文开题报告文献综述及选题提纲参考文献,主要关键词:云工作流,数据集分割,流程检索,并行检索
数据集检索论文文献综述
黄华,彭蓉,冯在文[1](2018)在《基于数据集分割的云工作流模型库并行检索方法》一文中研究指出在由多个行业云服务平台组成的集成服务平台中,随着行业云服务平台加盟数及各平台下租户数量的不断增多,其底层的云工作流模型库的规模也必将不断增大.当云工作流模型库的规模超大时,需要一种效率更高的并行检索方法去满足云工作流模型库高效检索的需求.鉴于此,采用均匀划分法或自动聚类法对大规模云工作流模型库进行合理的子集划分,并结合前期工作中已改进的基于图结构的流程检索算法,提出了基于数据集分割的大规模云工作流模型库并行检索方法.该方法主要包括4种流程并行检索算法:基于均匀划分模型集的静态并行检索算法、基于均匀划分模型集的动态并行检索算法、基于自动聚类模型集的静态并行检索算法和基于自动聚类模型集的动态并行检索算法.最后,在模拟生成的大规模流程集及真实的云工作流模型库中对这4种并行检索算法的检索效率进行了实验评估.(本文来源于《软件学报》期刊2018年11期)
彭雪莹[2](2015)在《JT-WFB:流程检索算法公共评价数据集设计与算法分析》一文中研究指出随着业务流程技术的快速发展和广泛应用,用户可更高效的构建更新业务流程管理系统,从而积累了大量跨领域异构业务流程,根据参考流程检索出相似流程(流程检索)这一需求也日益迫切。国内外相关学者围绕流程检索或流程相似度计算提出众多方法,但却缺乏一个公认的标准来科学客观评价现有流程检索方法的优劣。论文首先对当前流程检索技术做了一个简要综述,分别介绍了主流的基于结构、行为以及语义进行流程相似度计算方法的工作原理,并对这些算法的局限性进行了分析。继而论文通过分析流程图的结构和特点,结合基于经验的流程相似度判断标准,基于IBM提供的公开流程库构建得到一个流程检索算法评价标准数据集(JTang Workflow BenchMark, JT-WFB)。数据集由检索流程以及基于经验判断的评价标准得到的目标流程及排序构成。通过对比分析不同流程检索算法的结果与实际人为观察结果的差异性,我们可以更好的判断哪种算法更适应于当前状况。最后,论文基于JT-WFB数据集分别实现关注点不同的典型流程相似度算法,参考不同评价参数分别分析各种算法检索结果的准确率,从时间复杂度角度分析不同实现方法的效率。实验表明,单纯考虑检索目标是否被检索到,基于余弦相似度的行为算法效果最好,考虑到检索结果的排序时,贪心算法的结果更佳,然而时间复杂度极高。(本文来源于《浙江大学》期刊2015-09-10)
李贵宝,张卫民,宋涛,刘书涛,田广平[3](2015)在《人体断面数据集基于图像特征检索系统的建立》一文中研究指出目的建立人体断面数据集基于用户所需目标图像特征的检索系统。方法根据人体断面数字图像的特征,运用ASP.NET和C#技术实现整个图像采集平台和数字图像特征检索。结果基于人体断面数字图像特征检索,采用直方图均衡法对人体断面数字图像进行预处理,处理之后利用拉普拉斯和Canny边缘检测算法提取数字图像的特征~([1]),获取特征之后建立数字图像集的向量空间模型。根据树状结构的贝叶斯方法(TAN)构建图像特征检索模型~([2]),当进入拟检索目标图像之后,通过图像特征检索模型检索到用户所需目标图像。结论目标图像特征检索系统的建立,使用户准确、快速地查询到自己所需的断面数字图像。(本文来源于《第五届全国解剖学技术学术会议论文集》期刊2015-07-25)
孟烨,张鹏,宋大为,王雷[4](2013)在《信息检索系统性能对数据集特性的依赖性分析》一文中研究指出信息检索技术使得用户可以快捷有效地进行在线文档查找、浏览以及探索。尚未解决的重要问题是,文档集的固有特征与信息检索系统性能之间有何联系,进而这些联系可否被系统有效的方法辨识。本文旨在发展文档集的侧写理论及方法框架,并探索和发掘对信息系统效果有显着影响的数据集特征。我们将着重于研究基本语言学和统计特征,例如:数据集规模、文档长度、词项分布等众所周知对检索性能有影响的特征,并探索这些数据集特征和信息检索系统性能之间的关联。(本文来源于《需将论文集名称修改为“第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集》期刊2013-08-05)
纪秀艳,张崇辉,刘冠男[5](2013)在《中国地面气候标准值数据集资料的快速检索工具》一文中研究指出针对《中国地面气候标准值数据集(1981~2010)》数据文件数码众多,文件格式繁杂,手工检索困难的状况,根据数据集说明文件,编写自动检索工具,实现对整编资料的快速检索和导出,提高检索效率。(本文来源于《安徽农业科学》期刊2013年10期)
石源,莫蓉,常智勇,张欣,汪伟[6](2010)在《基于聚类的模型数据集可视化与检索》一文中研究指出为解决模型数据集可视化的问题,提出一种基于聚类结果的簇代表模型可视化方案.首先以等距特征映射算法作为模型特征数据的降维方法,将高维特征数据降至叁维,并以该叁维数据作为簇代表模型的空间位置坐标;然后采用粒子群优化算法得到模型簇的几何中值点,以距几何中值点最近的模型作为该模型簇的代表模型;最后结合模型的对齐方法来确定簇代表模型的姿态,从而实现模型数据集的可视化.另外,根据查询模型与簇代表模型之间的相似性,提出一个基于聚类结果的模型检索流程.该检索流程首先寻找与查询模型最相似的簇代表模型,然后将查询范围限制在这些簇代表模型对应的模型簇中,从而减少备选模型的数量.检索实验结果表明,在合适的参数组合下,该检索流程可以在保证检索精度的同时大幅提高检索效率.(本文来源于《计算机辅助设计与图形学学报》期刊2010年11期)
数据集检索论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着业务流程技术的快速发展和广泛应用,用户可更高效的构建更新业务流程管理系统,从而积累了大量跨领域异构业务流程,根据参考流程检索出相似流程(流程检索)这一需求也日益迫切。国内外相关学者围绕流程检索或流程相似度计算提出众多方法,但却缺乏一个公认的标准来科学客观评价现有流程检索方法的优劣。论文首先对当前流程检索技术做了一个简要综述,分别介绍了主流的基于结构、行为以及语义进行流程相似度计算方法的工作原理,并对这些算法的局限性进行了分析。继而论文通过分析流程图的结构和特点,结合基于经验的流程相似度判断标准,基于IBM提供的公开流程库构建得到一个流程检索算法评价标准数据集(JTang Workflow BenchMark, JT-WFB)。数据集由检索流程以及基于经验判断的评价标准得到的目标流程及排序构成。通过对比分析不同流程检索算法的结果与实际人为观察结果的差异性,我们可以更好的判断哪种算法更适应于当前状况。最后,论文基于JT-WFB数据集分别实现关注点不同的典型流程相似度算法,参考不同评价参数分别分析各种算法检索结果的准确率,从时间复杂度角度分析不同实现方法的效率。实验表明,单纯考虑检索目标是否被检索到,基于余弦相似度的行为算法效果最好,考虑到检索结果的排序时,贪心算法的结果更佳,然而时间复杂度极高。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
数据集检索论文参考文献
[1].黄华,彭蓉,冯在文.基于数据集分割的云工作流模型库并行检索方法[J].软件学报.2018
[2].彭雪莹.JT-WFB:流程检索算法公共评价数据集设计与算法分析[D].浙江大学.2015
[3].李贵宝,张卫民,宋涛,刘书涛,田广平.人体断面数据集基于图像特征检索系统的建立[C].第五届全国解剖学技术学术会议论文集.2015
[4].孟烨,张鹏,宋大为,王雷.信息检索系统性能对数据集特性的依赖性分析[C].需将论文集名称修改为“第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集.2013
[5].纪秀艳,张崇辉,刘冠男.中国地面气候标准值数据集资料的快速检索工具[J].安徽农业科学.2013
[6].石源,莫蓉,常智勇,张欣,汪伟.基于聚类的模型数据集可视化与检索[J].计算机辅助设计与图形学学报.2010