频繁结构挖掘论文-王利军,唐立

频繁结构挖掘论文-王利军,唐立

导读:本文包含了频繁结构挖掘论文开题报告文献综述及选题提纲参考文献,主要关键词:有序FP-tree,二维表,最大频繁项集,Order,Table,FPMax

频繁结构挖掘论文文献综述

王利军,唐立[1](2019)在《基于有序FP-tree结构和二维表的最大频繁模式挖掘算法》一文中研究指出Order Table FPMax是基于有序FP-tree结构和二维表的最大频繁模式挖掘算法.有序FP-tree结构可以减少空间的浪费.基于树结构的有序性,算法在挖掘数据时可以减少挖掘事务项的数量,加快挖掘效率.算法采用二维表存储挖据事务项的路径信息及交集,采用相应的计算方法可以在不产生条件子树的情况下快速得到最大频繁项集,并避免没必要的挖掘过程减少超集检测,既减少了空间的浪费,又加快了执行效率.(本文来源于《韶关学院学报》期刊2019年09期)

李峰[2](2019)在《基于极小数据结构的不确定频繁模式挖掘算法的研究》一文中研究指出近来为了满足处理不确定数据库的需求,人们提出了不确定模式挖掘的概念,并设计了各种相关的算法,但是这些算法花费大量的处理时间,而且挖掘精度不佳.提出了基于极小数据结构不确定频繁模式挖掘算法,实验结果显示该算法能够节省大量的处理时间,提高挖掘精度.(本文来源于《湖南工程学院学报(自然科学版)》期刊2019年02期)

尹远,张昌,文凯,郑云俊[3](2018)在《基于DiffNodeset结构的最大频繁项集挖掘算法》一文中研究指出在数据挖掘中,通过挖掘最大频繁项集来代替挖掘频繁项集可以大大地提升系统的运行效率。针对现有的最大频繁项集挖掘算法的运行时间消耗仍然很大的问题,提出了一种基于DiffNodeset结构的最大频繁项集挖掘(DNMFIM)算法。首先,采用了一种新的数据结构DiffNodeset来实现求交集以及支持度的快速计算;其次,引入一种新的线性复杂度的连接方法来降低两个DiffNodeset在连接过程中的复杂度,避免了多次的无效计算;然后,将集合枚举树作为搜索空间,同时采用多种优化剪枝策略来缩小搜索空间;最后,再结合最大频繁项集挖掘算法(MAFIA)中所使用的超集检测技术来有效地提高算法的准确性。实验结果表明,DNMFIM算法在时间效率方面性能优于MAFIA与基于N-list的MAFIA(NB-MAFIA),该算法在不同类型数据集中进行最大频繁项集挖掘时均有良好的效果。(本文来源于《计算机应用》期刊2018年12期)

刘余,龚后武,刘家庆,张泓[4](2018)在《基于隐结构模型和频繁项集的数据挖掘方法探讨慢性萎缩性胃炎的辨证取穴规律》一文中研究指出目的:探讨中医对慢性萎缩性胃炎的辨证取穴规律,为临床治疗慢性萎缩性胃炎提供参考。方法:计算机检索中国期刊全文数据库(CNKI)、中国生物医学文献数据库(CBM)、Pub Med等数据库中建库至2016年9月5日针刺辨证取穴论治慢性萎缩性胃炎的相关文献,提取症状、取穴处方信息构建慢性萎缩性胃炎医案数据库,采用隐结构模型、频繁项集等数据挖掘方法,分析针刺治疗慢性萎缩性胃炎的辨证取穴规律。结果:初检索出文献42篇,经筛选,共计纳入文献32篇,涉及604例病历资料。数据挖掘分析得出医案中共涉及215项症状,高频症状16项,包括胃脘疼痛、胃脘胀满、嗳气呃逆等,建立慢性萎缩性胃炎证候隐结构模型。统计出高频取穴处方,共涉及52个腧穴,其中高频取穴包括足叁里、中脘、内关、胃俞等;挖掘出症状-腧穴频繁项集5项,包括胃脘疼痛+胃脘胀满+足叁里+中脘等;症状-证型-腧穴频繁项集6项,其中包括胃脘胀痛+口干+大便干+胃阴不足证+叁阴交。结论:针刺治疗慢性萎缩性胃炎多以足叁里、中脘、内关为主穴,配穴依据临床情况辨证取穴,此可为临床治疗慢性萎缩性胃炎提供参考。(本文来源于《中国针灸》期刊2018年06期)

李丽,丁彦蕊[5](2018)在《基于频繁项集挖掘和连续帧间差分的脂肪酶时-空结构模式与耐热性的关系》一文中研究指出酶的热稳定性问题一直是蛋白质工程领域关注的重点。本研究通过枯草芽孢杆菌脂肪酶的不同模拟温度下的分子动力学模拟轨迹,分析野生型脂肪酶(WTL)及其突变体(6B)残基间相互作用对热稳定性的影响。首先确定残基间的空间关系,采用空间聚类和FP-growth算法,识别出保持协同运动的β3-β8以及C端部分区域,即确定刚性区;接着运用连续帧间差分法确定波动较大的柔性区,发现其主要位于转角处。以300 K常温状态下识别出的刚性区和柔性区为基础,考察刚性区和柔性区在不同温度下相互作用的动态变化规律,发现WTL和6B的刚性区内的相互作用几乎不随温度发生变化,在高温400 K时,WTL柔性区的稳定氢键数急剧减少为7,6B柔性区的稳定氢键数随温度变化较为稳定。另外,6B的柔性区较WTL少了310螺旋,这是由于突变后的Ser15与突变后的Ser17形成强大的氢键作用,A15S和F17S突变改善了脂肪酶结构的柔性使其热稳定性增强。(本文来源于《中国生物化学与分子生物学报》期刊2018年03期)

付玮琦[6](2017)在《基于Schema特征的半结构化数据流频繁模式挖掘算法的研究》一文中研究指出随着信息技术的发展,海量的数据正不断地产生,对数据的分析已经不再是人力所能完成的任务,对应这一问题,人们提出了数据挖掘技术。数据挖掘是从大量的数据中发现隐藏在其中有意义的信息的过程,而频繁模式挖掘则是数据挖掘中的一项重要工作。频繁模式指的是数据中多次重复出现的数据片段,频繁模式挖掘即从大量的数据中找出这些频繁模式。在对频繁模式挖掘的研究中,对半结构化数据挖掘的研究已经有了不小的进展,对数据流挖掘的研究也已经有了一定的基础,然而将两点结合在一起的研究却相对较少。因此如何高效准确地对半结构化数据流进行频繁模式挖掘,成为了本文研究的重点。半结构化数据流同时具有数据流的实时、有序、无限、连续等特点以及半结构化数据独特的树形结构。针对以上这些特点,本文提出了一个基于时间窗口的可以实现对半结构化数据流进行挖掘处理的模型,将半结构化数据流序列化并进行分段,然后使用本文提出的SPrefixTreeISpan算法对每个数据段分别进行挖掘,最后将挖掘结果保存在一个patternTree结构中进行维护。对于半结构化数据流分段造成的挖掘结果不准确的问题,本文提出了一个checkStack结构以及对应的处理策略。本文将XML数据流作为挖掘对象。由于XML数据往往通过XML Schema定义它的数据结构,通过分析Schema,从中提取出了必然孩子关系和必然父亲关系,并对本文算法进行了优化,最终提高了挖掘效率。最后,通过实验证明,本文算法具有良好的挖掘效率,同时基于Schema特征的优化策略是有效的。(本文来源于《北京工业大学》期刊2017-06-01)

童子奇[7](2017)在《一种实时的半结构化数据流频繁模式挖掘算法》一文中研究指出随着大数据时代的到来,半结构化数据比如图形数据、树形数据、序列数据等广泛地应用在语义网络、社会关联分析、大分子信息挖掘等领域。如何挖掘其中的关联信息是半结构化数据挖掘的关键。但是,半结构化数据结构复杂、存储困难等特点使得使用传统算法对其进行挖掘的难度较大。与此同时,越来越多的数据流出现在人们的视野中,例如来自社交网络、金融管理、信息监控等实时系统的数据流在在日常生活中起到越来越重要的作用。这些数据流不仅具有数据量巨大、数据流流速快等特点,而且人们往往更关注的是当前时刻的数据流,实时性要求比较高。如何从这些海量且复杂的流数据中,实时且高效地获得人们关注的数据,是大数据技术发展需要解决的问题。随着大数据技术的发展,应用需求越来越复杂,半结构化数据流处理需求不断增长。但是,现有的半结构化数据挖掘方法无法满足流数据处理的要求。针对这个问题,本文改造了现有的半结构化数据挖掘方法,提出一种基于时间衰减模型和批量更新模式的挖掘算法,能够进行半结构化数据流的频繁模式挖掘。该算法通过时间衰减模型增加新数据的权重、降低历史数据的权重来降低挖掘过程中过期数据的影响,获得实时的挖掘结果;通过批量更新模式对已挖掘数据的有用信息进行保留来避免了传统数据流挖掘算法中对数据库进行反复扫描、多遍处理的问题,有效防止资源的浪费。通过对比实验表明,该算法实现了半结构化数据流挖掘功能,能够高效地处理复杂且高速到达的海量半结构化数据流,能够降低历史数据的影响实时地获得数据流中频繁模式数据,可以满足当下半结构化数据流挖掘的需求。(本文来源于《北京工业大学》期刊2017-05-01)

李洪旭[8](2017)在《图的频繁子结构挖掘方法研究》一文中研究指出随着互联网、数据库等信息技术的快速发展,网络上产生并积累了大量Xml文档、Web网页、化学化合物、生物分子等半结构化数据,这些结构复杂的数据往往隐藏了丰富的知识。频繁模式挖掘可以发现潜在的规律和模式,在实际应用中被广泛使用。图作为一种重要的数据结构,能够表达丰富的语义,适合用于半结构化数据建模。对半结构化数据的频繁模式挖掘可以转化为对图的频繁子结构挖掘。图的频繁子结构挖掘主要分为树(无环图)的频繁子结构挖掘和图(有环图)的频繁子结构挖掘两个方向。对于树的频繁子结构挖掘,目前主要有基于“候选子结构-计算支持度”和基于“投影数据库”思想的两类算法。本文针对基于“候选子结构-计算支持度”思想的相关算法不能生成所有候选子树而造成频繁子树信息遗漏,以及输出大规模且带有冗余信息的频繁子树进而影响后续分析效率的不足分别提出了GAST(Get All SubTrees)算法和MCRP(Mining Coverage Pattern)算法。GAST算法采用宽度孩子数编码方式对树中的结点进行编码,并在此基础上采用最大前缀编码序列进行边扩展生成所有候选子树,避免了信息的遗漏。MCRP算法在GAST算法基础上,只输出满足-覆盖条件的频繁子树,即覆盖模式,降低了输出频繁子树信息的冗余。对于图的频繁子结构挖掘,目前主要是基于“候选子结构-计算支持度”思想的算法。该类算法在计算候选子图支持度时涉及到子图同构判断,导致算法时间效率较低。针对这类算法的不足,本文借鉴树的频繁子结构挖掘中基于“投影数据库”的思想,提出了MFSGBPC(Mining Frequent SubGraph Based on Projection Coding)算法用于挖掘频繁子图。该算法将计算候选子图支持度的操作转换为了计算候选结点支持度的操作,避免了子图同构判断操作,在一定程度上提高了时间效率。理论分析和实验表明,与传统频繁子图挖掘算法相比,本文所提出的MCRP算法更加有效,能生成所有候选子树且避免冗余;MFSGBPC算法避免生成候选子图和计算候选子图支持度,在效率上有所提升。(本文来源于《重庆邮电大学》期刊2017-04-06)

李巍,李雄飞,郭建芳[9](2013)在《XML空间频繁变化结构挖掘方法》一文中研究指出XML数据在实际使用过程中不断发生改变,针对XML数据动态可变的特点,提出一种根据XML数据变化过程挖掘XML空间频繁变化结构SFCS(Spatial Frequently Changing Structure)的方法,首先提出XML子结构空间度量方法,通过结构空间变化度SSCD、版本空间变化度VSCD和空间变化程度SCD这3个度量值衡量XML子结构的空间变化频繁性并提出SFCS定义.进一步,提出一种用于保存XML空间变化信息和发现SFCS的数据模型SC-DOM,论证了XML编辑操作对子结构空间的影响并据此提出SC-DOM状态动态迁移方式,最后提出根据SC-DOM发现SFCS的算法并讨论算法复杂度.实验结果表明SFCS是频繁变化的结构,使用SC-DOM模型进行SFCS挖掘是有效且可扩展的.(本文来源于《计算机学报》期刊2013年02期)

王春华,宁慧,邹韵,郭江鸿[10](2013)在《基于图的四叉链表存储结构的最大频繁项集挖掘算法》一文中研究指出虽然已有的最大频繁项集挖掘算法在结构和技术上已经做了很多改进,但还是存在挖掘速度慢、效率低的缺点,在此提出了图的四叉链表存储结构和基于该存储结构的最大频繁项集挖掘算法,该结构具有一次生成多次使用,不必耗用额外的存储空间等特点,基于该存储结构的最大频繁项集挖掘算法充分利用了该存储结构的特点以及频繁扩展集的性质,有效地减少了冗余候选集的生成,降低了串的冗余存储,将串集合间的比较转化为整型数组的比较,从而使得它比已有的最大频繁项集挖掘算法在挖掘效率上有了明显的提高,最后通过实验证明了该算法较其他已有算法效率有了较大的提高.(本文来源于《应用科技》期刊2013年01期)

频繁结构挖掘论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

近来为了满足处理不确定数据库的需求,人们提出了不确定模式挖掘的概念,并设计了各种相关的算法,但是这些算法花费大量的处理时间,而且挖掘精度不佳.提出了基于极小数据结构不确定频繁模式挖掘算法,实验结果显示该算法能够节省大量的处理时间,提高挖掘精度.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

频繁结构挖掘论文参考文献

[1].王利军,唐立.基于有序FP-tree结构和二维表的最大频繁模式挖掘算法[J].韶关学院学报.2019

[2].李峰.基于极小数据结构的不确定频繁模式挖掘算法的研究[J].湖南工程学院学报(自然科学版).2019

[3].尹远,张昌,文凯,郑云俊.基于DiffNodeset结构的最大频繁项集挖掘算法[J].计算机应用.2018

[4].刘余,龚后武,刘家庆,张泓.基于隐结构模型和频繁项集的数据挖掘方法探讨慢性萎缩性胃炎的辨证取穴规律[J].中国针灸.2018

[5].李丽,丁彦蕊.基于频繁项集挖掘和连续帧间差分的脂肪酶时-空结构模式与耐热性的关系[J].中国生物化学与分子生物学报.2018

[6].付玮琦.基于Schema特征的半结构化数据流频繁模式挖掘算法的研究[D].北京工业大学.2017

[7].童子奇.一种实时的半结构化数据流频繁模式挖掘算法[D].北京工业大学.2017

[8].李洪旭.图的频繁子结构挖掘方法研究[D].重庆邮电大学.2017

[9].李巍,李雄飞,郭建芳.XML空间频繁变化结构挖掘方法[J].计算机学报.2013

[10].王春华,宁慧,邹韵,郭江鸿.基于图的四叉链表存储结构的最大频繁项集挖掘算法[J].应用科技.2013

标签:;  ;  ;  ;  ;  ;  

频繁结构挖掘论文-王利军,唐立
下载Doc文档

猜你喜欢