导读:本文包含了过程挖掘算法论文开题报告文献综述及选题提纲参考文献,主要关键词:过程挖掘算法,Spark集群,大数据,并行分布式化
过程挖掘算法论文文献综述
胡小强,吴翾,闻立杰,王建民[1](2019)在《基于Spark的并行分布式过程挖掘算法》一文中研究指出针对传统的过程发现算法对大规模事件日志挖掘效率低的问题,提出一种利用Spark集群进行加速过程挖掘的方法。该方法主要针对基于日志活动关系的过程挖掘算法,对抽取活动关系阶段进行加速。通过并行分布式抽取活动关系,将事件日志转化为活动关系矩阵。然后利用关系矩阵,按算法原本的后续步骤,挖掘出过程模型。利用Spark实现分布式α-Mine算法和分布式Flexible Heuristic Miner算法,结果表明:所提方法在时间消耗上优于目前最好的算法,挖掘效率明显提升。(本文来源于《计算机集成制造系统》期刊2019年04期)
李鹏,刘庆金,杜玉越[2](2019)在《基于遗传算法的医院门诊过程挖掘算法》一文中研究指出为充分开发利用医院信息系统产生的数据资源,优化医院门诊诊疗过程,将信息技术和管理技术相结合,提出一种基于遗传算法的过程挖掘算法。该算法能充分利用医疗信息系统产生的日志数据资源,挖掘出优化的医院门诊就诊过程,提高医院运行效率。通过医院信息系统的门诊患者就诊过程及对应数据验证了所提方法的正确性与有效性。(本文来源于《计算机集成制造系统》期刊2019年04期)
郝建军[3](2018)在《服装营销过程中的数据挖掘算法分析》一文中研究指出当今信息化发展速度惊人,大数据、云计算、人工智能技术应用于各行各业,给社会的发展带来了很多便利,也为我国经济的快速发展注入了新的血液。在服装行业中,我国是一个纺织服装生产大国,又是一个纺织服装消费与出口大国,将大数据技术应用于纺织服装生产与销售中可以给纺织服装产业带来更大的利润,本文主要研究在众多的数据挖掘算法中,适合服装营销的挖掘算法。(本文来源于《电脑迷》期刊2018年08期)
代明竹,高嵩峰[4](2018)在《基于考试过程和知识结构的数据挖掘算法研究》一文中研究指出为了研究学生在不同阶段对知识点的掌握情况,基于对数据挖掘的理论研究,把知识结构与考试成绩相结合来进行数据研究。以教育测量学为基础,结合数据挖掘的决策树算法,针对原有的C4.5算法提出改进算法,应用试卷中涉及到的知识点的难易程度与知识点种类进行知识结构细化,以便确定单个学生或群体学生对知识点的掌握程度和试卷中各知识点之间的关系。结果显示,改进后算法的计算公式比原计算公式简单实用;根据决策树模型,使用剩余数据对计算公式进行验证,能够更快地得出对程序设计这个知识点的掌握是影响成绩相对重要的因素。使用测试数据对已创建的决策树进行验证,准确率为90%。最后对决策树进行可视化展示,为学生的学习安排、教师的教学方案及安排等提供有效的参考。(本文来源于《计算机科学》期刊2018年S1期)
贺朝阳,杜玉越,王路[5](2018)在《特殊循环结构的过程挖掘算法》一文中研究指出为解决并发结构中循环挖掘问题,在α算法基础上,针对一类特殊循环结构提出了一种αfsl算法。该算法重新定义了包含循环结构的日志完备性,并在基本活动次序关系的基础上,添加了新的循环次序关系。通过预处理日志,提取日志中重复出现的活动,列出重复活动的相邻关系,从中发现日志中存在的循环结构,以后期添加循环结构的方式挖掘基于工作流网的过程模型。最后,通过对某电脑维修公司的实例分析,验证了αfsl算法的有效性与正确性。(本文来源于《计算机工程与应用》期刊2018年22期)
易科[6](2018)在《不完备日志的过程挖掘算法研究》一文中研究指出现代企业为了生产高效化、服务优质化,不断地改善其业务过程运营,引入了工作流管理系统、ERP等过程信息感知系统。过程挖掘可以利用系统实施过程保存下来的信息系统日志挖掘出客观知识。这些被发现的客观知识有助于新业务系统的部署,或者作为一种反馈工具,改善已经存在的业务过程。本文主要研究过程挖掘中的控制流、组织视角。首先,通过了解过程挖掘领域国内外的研究现状,对过程挖掘的不同算法有了深入理解,发现在挖掘控制流视角方面存在着不完备日志问题。为了解决这一问题,本文将业务领域人员的先验知识定义成一套约束规则,以依赖图为基础,提出了一种不完备日志的过程挖掘算法,并就算法中初始依赖图的构造、满足消极和积极约束,以及绑定操作等几个关键性步骤进行了详细的阐述和论证;在挖掘组织视角方面,传统过程挖掘算法在发现带有多重角色身份资源的能力上存在着缺陷,本文在获取一个社会网的基础上,以优化网的模块为目标,获得资源社区的划分。同时还可以将社会网进一步转换成带权社区网,在带权社区网的基础上,探寻社区的最大适应度邻居,以进而形成资源角色网,找到资源在不同社区中所扮演的角色;最后通过实验验证了算法的正确性。在日志不完备的情况下,本文的算法以形式化的方式对消极路径约束的关系进行了分类,简化了满足该类约束所需要采取的操作步骤,即增加和删除边的数量变少了。满足积极约束的过程时,算法采用权值更新操作寻找满足积极约束的最优路径,有效地提高了算法的执行效率。绑定操作对模型的行为进行了必要的限制,减少了非原始日志轨迹的生成,最终挖掘到的过程模型更贴切原始模型。在挖掘日志中的资源方面,本文中的算法解决了传统算法不能挖掘重迭社区的问题,社区划分后网的模块性更高,且能发现具有多重角色身份的资源。(本文来源于《华侨大学》期刊2018-03-26)
谢俊[7](2018)在《基于信息熵和轨迹聚类的抗噪过程挖掘算法》一文中研究指出随着工业智能化的到来,自动化生产越来越迫在眉睫,越来越多的企业开始在生产中使用业务流程管理系统。随着业务流程管理系统的运行,累积了越来越多的业务流程日志等数据,如何有效利用和分析这些事件日志是人们亟待解决的问题。过程挖掘技术是业务流程管理中的重要内容之一,可从事件日志中抽取过程知识,构建过程模型,有助于企业流程的检测并对其进行改进。本文通过调查过程挖掘技术在国内外的研究现状,梳理了其发展过程及具有代表性的过程挖掘算法,发现大多数过程挖掘算法在处理日志噪声方面存在不足,一些过程挖掘算法忽略噪声带来的影响,不具有客观性,而大多数可处理噪声的过程挖掘算法无法给出合理的去噪阈值。为了解决该问题,本文给出基于最大熵原则的去燥阈值方法,用于去除事件日志噪声对过程挖掘结果的影响,然而,此方法仅仅适用于稠密日志,因此,本文进行了优化,给出基于轨迹聚类的去噪方法,识别噪声轨迹。另外,本文在改进的频次矩阵的基础上,根据日志中的活动频次关系识别循环结构、选择结构、并行结构和非自由选择结构。最后给出了自适应去噪构建过程模型的算法。本文给出的算法是信息熵在过程挖掘领域中去除噪声的一种新的尝试。求得的去噪阈值参数不需人为进行设置,可根据事件日志自适应确定,因此给出的算法鲁棒性较好。最后,实验验证了本文提出的算法在挖掘含有噪声的日志时具有更高的拟合度、行为合理度、精确度与召回率。(本文来源于《上海大学》期刊2018-01-01)
易科,叶剑虹[8](2017)在《不完备日志的过程挖掘算法》一文中研究指出算法能够在日志不完备的情况下,首先构造初始依赖图,根据依赖图所需满足的消极边约束条件,直接删除禁止的边,对于消极路径约束,需要针对约束关系进行分类以删除因果值最小的边.对于积极边约束,可直接添加所需的边,但对于积极路径约束,还需进一步计算出权值最优的路径以添加到模型中.为使构造出的网结构更吻合原始模型,随后还通过绑定操作生成一个支持原有日志轨迹的因果网.算法通过对消极的约束关系分类,减少了对消极约束的处理,同时在积极约束上采用权值更新最优算法提高效率.绑定操作可以进一步帮助我们约束网模型的行为,减少非原始日志轨迹的生成.整个挖掘算法,比已有的算法在效率上有显着提升,同时新增了一些对复杂约束条件的处理能力.(本文来源于《小型微型计算机系统》期刊2017年11期)
余建波,董晨阳,李传锋,程辉,孙习武[9](2018)在《基于统计α算法的过程挖掘》一文中研究指出过程挖掘算法是从管理信息系统产生的事件日志中提取信息、发现知识并实现工作流建模的工具,也是目前工作流最主要的建模工具。然而现有的过程挖掘算法存在准确度较低、运行时间长和拟合度过高等问题,影响最终工作流模型的准确率。提出了一种基于统计α算法的过程挖掘算法,在保证算法较高的准确率和合适的拟合度的同时,降低算法运行时间,保证了算法的效率。首先,提出了重名活动识别算法,作为过程挖掘的预处理活动,提高了算法的准确性;其次,提出了统计α算法作为过程挖掘核心算法,有效消除了事件日志中噪声的影响;最后,提出了新的非自由选择结构识别算法,进一步提高了算法的鲁棒性和准确率。通过仿真实验和真实案例验证了该算法在准确率和运行时间上的优越性。(本文来源于《北京航空航天大学学报》期刊2018年05期)
余建波,董晨阳,李传锋,刘海强[10](2017)在《基于统计α算法的临床路径过程挖掘》一文中研究指出针对临床路径事件日志中存在的重名活动和噪音数据,提出集成重名活动判别的过程挖掘算法:统计α算法.给出一套完整的重名活动的判别规则,用于识别过程挖掘中的重名活动并进行相应预处理,有效地提高了过程挖掘的准确性;提出基于经典α算法改进的统计α算法,用于消除事件日志中各种噪音的影响.该算法在临床路径数据量较大的情形下,保证了结果准确率和运算效率.统计α算法在三甲医院的临床数据上得到成功应用,与经典α算法和遗传算法相比,该算法在效率和准确性上更具优越性.(本文来源于《浙江大学学报(工学版)》期刊2017年10期)
过程挖掘算法论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为充分开发利用医院信息系统产生的数据资源,优化医院门诊诊疗过程,将信息技术和管理技术相结合,提出一种基于遗传算法的过程挖掘算法。该算法能充分利用医疗信息系统产生的日志数据资源,挖掘出优化的医院门诊就诊过程,提高医院运行效率。通过医院信息系统的门诊患者就诊过程及对应数据验证了所提方法的正确性与有效性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
过程挖掘算法论文参考文献
[1].胡小强,吴翾,闻立杰,王建民.基于Spark的并行分布式过程挖掘算法[J].计算机集成制造系统.2019
[2].李鹏,刘庆金,杜玉越.基于遗传算法的医院门诊过程挖掘算法[J].计算机集成制造系统.2019
[3].郝建军.服装营销过程中的数据挖掘算法分析[J].电脑迷.2018
[4].代明竹,高嵩峰.基于考试过程和知识结构的数据挖掘算法研究[J].计算机科学.2018
[5].贺朝阳,杜玉越,王路.特殊循环结构的过程挖掘算法[J].计算机工程与应用.2018
[6].易科.不完备日志的过程挖掘算法研究[D].华侨大学.2018
[7].谢俊.基于信息熵和轨迹聚类的抗噪过程挖掘算法[D].上海大学.2018
[8].易科,叶剑虹.不完备日志的过程挖掘算法[J].小型微型计算机系统.2017
[9].余建波,董晨阳,李传锋,程辉,孙习武.基于统计α算法的过程挖掘[J].北京航空航天大学学报.2018
[10].余建波,董晨阳,李传锋,刘海强.基于统计α算法的临床路径过程挖掘[J].浙江大学学报(工学版).2017