导读:本文包含了图挖掘论文开题报告文献综述及选题提纲参考文献,主要关键词:组件分析,图形挖掘,网络拓扑,顶点目标搜索
图挖掘论文文献综述
余平,胡玲[1](2019)在《基于快速图挖掘的网络拓扑局部调节区域算法》一文中研究指出针对IP骨干网重新配置中繁重工作量的问题,提出一种快速图挖掘算法来解决网络拓扑的局部调节区域问题,解决了从网络拓扑中找到组件时子图同构的NP-hard问题,减少了网络重构的操作工作量.该文提出的启发式图挖掘算法顶点,称为顶点目标搜索(vertex targeting search,VTS)算法,通过考虑网络操作条件减少了搜索空间的大小.实验结果表明,该文方法可以快速得到搜索网络模式图,与其他方法比较,该文具有较少的搜索时间,说明该文方法具有可行性和有效性.(本文来源于《西南师范大学学报(自然科学版)》期刊2019年05期)
陆凯[2](2019)在《基于图挖掘的错误定位方法研究》一文中研究指出现如今计算机软件已经涉及社会发展的各个方面,为了保证软件质量,人们更加注重软件测试。程序调试是软件测试中比较困难的任务,其中错误定位是程序调试中比较费力的一步,提升软件错误定位效率能够有效减小调试代价。因此,研究有效的错误定位方法,对提高程序调试效率,减少软件测试的成本以及保证软件的质量具有重要意义。国内外众多研究人员提出了多种软件错误分析与定位方法,然而现有方法在错误定位过程中存在忽略了一些程序执行统计信息和错误定位结果缺少错误相关上下文信息等问题。本文在分析研究了已有方法与技术的基础上,针对性地提出了基于图挖掘与支持向量机的错误定位方法和基于化学反应优化的错误定位方法,并且实现了一个基于化学反应优化的错误定位工具。针对现有方法在错误定位过程中忽略了一些程序执行统计信息的问题,本文提出了一种基于图挖掘与支持向量机的错误定位方法。该方法首先收集程序执行轨迹并建模为软件行为图;之后,约简行为图构建加权软件行为图,并且利用图挖掘算法挖掘封闭子图,记录下频繁边;最后,将软件行为图转化为特征向量,结合支持向量机对所有执行进行分类,识别分类精度明显提升的方法加入可疑方法集合进行错误定位。实验结果表明该方法能够提升分类精度,促进对错误产生根源的理解。针对现有方法提供的错误定位结果缺少错误相关上下文信息的问题,本文提出了一种基于化学反应优化的错误定位方法。该方法首先收集程序执行轨迹构建软件行为图并对其约简;然后,根据失败执行的软件行为图映射程序状态上下文信息,对上下文编码,定义分子结构利用化学反应优化算法迭代搜索最优分子种群;最后,将种群中分子解码转化为程序状态上下文进行错误定位。实验结果表明该方法能够提供执行失效相关的上下文信息,促进对程序执行失效原因的理解。在此研究的基础上,利用Java设计并实现了一个基于化学反应优化的错误定位工具FLUCRO,提供了可视化界面便于进行参数配置。综上,本文针对软件错误定位现有方法中存在的一些问题,提出了两种软件错误定位方法,同时实现了一个软件错误定位工具帮助开发人员更快地定位错误。(本文来源于《中国矿业大学》期刊2019-05-01)
孙欢欢,郭浩,陈俊杰[3](2018)在《面向脑网络的图挖掘及特征选择方法》一文中研究指出为解决面向一般图的频繁子图挖掘忽略了脑网络自身特点的问题,根据脑网络结点唯一性的特点,提出面向脑网络的不确定图上的频繁子图挖掘算法。针对已有的不确定图判别性特征选择方法分类精度不高的问题,提出几种判别性特征选择方法。通过计算子图模式在样本中出现概率的均值、方差等指标,结合已有确定图中的判别分数函数,计算子图模式的判别分数。实验结果表明了该方法的有效性。(本文来源于《计算机工程与设计》期刊2018年09期)
孙欢欢[4](2018)在《面向脑网络的不确定图挖掘及特征选择方法研究》一文中研究指出目前,人类已经对其所处的自然界有了广泛而深刻的认知。在人类认识世界的过程中,逐渐形成了研究各个领域的学科,如物理学、化学、生物学,在这些学科中人们取得了举世瞩目的成就。而这些成就的取得依赖于一个异常复杂的系统:大脑。由于人脑的复杂性及其特殊性,人们对于大脑的奥秘依然所知甚少。近年来,随着科技的发展和研究水平的提高,越来越多的研究人员开始投入到大脑的研究中,这一领域也被认为有着广阔的研究前景。对大脑的研究,通常集中于脑疾病方面,如抑郁症(Major Depressive Disorder,MDD)。以往典型的是采用脑网络的方法,构建脑网络的确定图,并在确定图上进行频繁子图挖掘和判别性特征选择。但是,由于脑网络的连接结构具有内在的不确定性,如果利用阈值方法直接将其转化成确定图,无论是单阈值还是多阈值,都会造成信息的丢失。若将脑网络构建成不确定图,已有的不确定图频繁子图挖掘算法,主要是面向一般图而设计,忽略了脑网络自身的特点,如脑网络结点的唯一性,这可能影响到脑网络分类的性能。另外,对不确定图的频繁子图模式进行判别性特征选择,确定图中的方法不适用,目前还没有非常有效的方法。针对上述问题,本研究基于核磁共振影像数据,构建脑网络的不确定图,提出了一种面向脑网络的不确定图频繁子图挖掘算法,并提出了一种新的判别性特征选择方法。本文所做的主要工作如下:第一,脑网络的构建。为了充分比较两种网络构建方法对实验结果的影响,本文分别构建了确定图脑网络和不确定图脑网络。确定图网络采用传统的二值化方法,利用稀疏度确保每一个网络有相同数量的边。不确定图网络省略了二值化的过程,但保留了全连接网络中所有非负的边。边的权重计算采用皮尔逊相关系数。第二,提出面向脑网络的频繁子图挖掘算法。该方法根据同一脑网络中节点唯一性和不同脑网络中节点一一对应性的特点,借鉴了确定图中和不确定图中的频繁子图挖掘思想。实验结果表明,该方法有效降低了频繁子图模式的数量和支持度。第叁,提出一种新的面向脑网络的判别性特征选择方法。该方法利用每个子图模式在正负样本中出现概率的和、均值、方差、偏度、峰度等指标,把只能应用在确定图中的判别分数函数,推广到不确定图中。为了评价各种方法之间的性能,在本实验数据集下对各个方法进行了实验,并对结果进行了分析与比较。(本文来源于《太原理工大学》期刊2018-06-01)
尚华婷[5](2018)在《基于多层狄利克雷过程的图挖掘主题模型》一文中研究指出主题模型在发现文本潜在主题方面已被证明是非常成功的,但是以往人们所研究的主题模型都基于“词袋”假设,忽略了词之间的关联。另一个问题是隐藏的主题数目往往需要预先确定。然而在实际应用中,确定适当数目的主题非常困难,有时是不现实的。本文提出一种基于多层狄利克雷过程的非参数贝叶斯主题模型HDP-GTM,该模型考虑了词与词之间的关联,将文本数据表示为图结构数据。同时通过多层狄利克雷过程实现了主题数目的灵活选取,突破了经典主题模型需要预先给定主题数目的局限性。由于HDP-GTM模型突破了传统主题模型“词袋”的限制,考虑了数据的图结构性质,充分利用了更多的数据信息,从而使得文本分类效果显着提升。通过实验,进一步验证了本文提出的HDP-GTM模型的有效性和优越性。(本文来源于《华东师范大学》期刊2018-04-01)
陆凯,姜淑娟,王兴亚[6](2018)在《结合图挖掘和支持向量机的错误定位》一文中研究指出已有错误定位方法通常只给出可疑语句的排序列表,缺少错误的上下文信息,导致开发人员难以理解程序失败的原因。对此,提出结合图挖掘和支持向量机(support vector machine,SVM)的软件错误定位方法。首先,根据程序调用信息将程序建模为加权行为图;其次,应用支持向量机提取频繁边对所有执行分类,并通过分类精度的变化度量方法的可疑度,最终生成一个可疑方法集合帮助开发人员判断错误位置。实验结果显示使用频繁边作为特征执行分类保持或者提升了分类精度,表明了方法的有效性。(本文来源于《计算机科学与探索》期刊2018年10期)
王彦博,李金铮,杨永闳[7](2017)在《基于图挖掘的公司业务批量获客新模式》一文中研究指出国际经济形势复杂多变,中国经济步入新常态,利率市场化进程加速,互联网金融横空出世、大行其道,"金融科技"跨界融合导致金融脱媒加剧。在这样的背景下,国内银行业竞争日渐激烈,商业银行的客户流失现象越发明显,同时银行除了需要关注对老客户的(本文来源于《金融电子化》期刊2017年07期)
崔豪驿[8](2017)在《基于图挖掘的医疗滥用欺诈检测分析》一文中研究指出近年来,健康中国逐步上升为国家战略,医保建设在经济社会发展中占据着重要的地位。随着医疗信息化的不断普及和推进,医保欺诈也越来越被确认为一种严重的社会问题。医疗滥用是医保欺诈中一种主要的欺诈方式,这种欺诈方式主要是指医疗机构或医生提供的药品或者医疗用品与实际治疗所用的不一致或者违背医疗用药标准,从而增加医疗保健支出。各种医疗保险欺诈案件屡见不鲜,大大损害了被保险人的利益,对医保基金的安全造成了重大的损害,严重阻碍了医保政策的实施和推广。尽管,医疗欺诈不是最近发生的一种问题,并且各种欺诈检测方法被提出来解决这个问题,但是医疗欺诈问题仍然没有得到很好的解决。首先,一些基于检测规则的传统检测方法通过专家定义的欺诈和非欺诈规则来找出违规的行为。这些方法往往受限于专家的知识水平。其次,虽然有许多文献提出了各种不同的方法来解决欺诈问题,这些文献中的监督方法专注于将欺诈问题定义为一种二分类问题。医保数据是一种分布很不均衡的数据集,其中包含大量的正常记录以及较少量的欺诈记录,这种偏斜的类分布性使得从大量正常数据中区分出极少量的欺诈数据比较困难。随着时间的推移,医保数据集也根据内部或外部的因素动态变化,从而医保欺诈检测结果不是很理想。最后,监督学习方法为了产生一个更准确欺诈检测结果,需要对训练数据中涉及的大量实体的属性进行分析。这项工作花费了大量的精力和精力,甚者有些属性违反了在医疗领域隐私政策。而基于聚类的离群检测和聚类分析等无监督方法由于输入的参数较少,只需要了解少量的信息,所以获得的结果的准确性往往达不到欺诈检测的要求。因此需要一种涉及较少量非隐私属性、较高准确度的医保欺诈检测方法。本文的具体工作和贡献概括如下:1.提出了一个基于医生信任度的医保欺诈检测方法GM-FP。这个方法通过医生信任度这个关键特征将图挖掘和频繁模式挖掘结合起来,仅仅使用医疗记录来训练一个关于某种疾病的合理治疗模型(药品和医疗设施的种类、数量及之间的关系),并基于未知记录与合理模型的相似程度来判断记录是否存在欺诈。2.提出一种基于医疗记录数据集内部特征和网络图探索的异常检测方法—IF-NE。对于每个医保记录,IF-NE通过分析该记录的内部特征和基于网络的特征,并根据特征选择合适的分类器来对正常记录和异常记录进行分类,从而决定该医保记录是否是欺诈记录。内部特征是基于RMF(新进度、频率和花费金额)来获取的。基于网络的特征提取丰富了医生—病人二分图网络模型,将医疗记录加入形成医生—病人—医保记录叁分图模型;同时,利用了一种用于通过网络从有限集合的标记边(即欺诈医保记录)推断所有网络组件(即医生、病人和医保记录)的分数的新算法来获得基于网络特征。最后,利用随机森林基于数据特征对记录进行欺诈检测,结果表明该方法比基准方法效果更好。3.提出一种基于稀有标签传播的欺诈检测方法。该方法改进了传统的基于凸标签传播的标签传播方法,通过凸凹变换,将凸标签传播算法转变为稀有标签传播的非凸标签传播算法,从而解决了标签传播算法在集监督程度低、类不平衡性高的医保数据集上性能降低的问题。(本文来源于《山东大学》期刊2017-06-30)
许乔若[9](2017)在《基于图挖掘的推特事件关联性分析方法研究》一文中研究指出随着互联网的发展,社交媒体在人们生活中的应用越来越多样化。而推特(Twitter)作为社交媒体中的佼佼者,已经成为近年来最流行的社交媒体应用之一。而社交媒体在政治事件中的影响也在与日俱增。2012美国总统奥巴马连任、英国脱欧公投等一系列政治事件的背景中都出现了推特的身影。推特在事件传播、反映民众的政治倾向上有逐步取代传统民意调查的趋势。目前在社交媒体上的政治倾向研究主要针对文本中的特定信息来进行分析,例如推文中的标签(hashtag)、提到(@)等。由于社交媒体数据不具有正式性,所以政治倾向分析的结果不够精确。同时对于社交媒体中的大选选情预测并没有特别完善的流程和方案。所以,本文通过图挖掘的方法,对社交媒体中的政治类事件进行分析研究。针对2016美国总统大选选情预测的问题,提出并设计了大选选情预测模型。本文的主要工作和创新点概括如下:(1)在推特数据上进行政治倾向情感分析和大选相关事件检测。在情感分析上,针对推特信息简短、非正式、缺乏补充信息的特点,本文采用了基于字典的情感分析方法,对推文的政治倾向性进行判断。同时对于情感分析中的反语鉴别难点,通过推文的表情符以及用户的历史推文来提升情感分析的结果。在事件检测中,针对美国总统大选的背景,本文采用了多次聚类、同义词拓展,关键词权重提升等方法,来对碎片事件进行整合。该方法提升了大选相关事件检测的性能。(2)利用图挖掘的方法来对推特数据进行研究分析。由于推特数据源上有多种多样的信息,例如用户,推文,图片,视频等等。而用户的点赞,转发和评论行为,往往也会表露出用户的政治倾向。所以,本文采用复杂网络分析方法,将不同类型的社交媒体数据投影到复杂网络中,再根据实际需求,对社交媒体复杂网络进行分析。在大选预测结果中发现支持总统候选人的用户社团。这种分析方法不仅仅适用于大选选情预测,还可以应用于社交媒体的舆论导向分析、用户影响力等方面。本文使用了真实社交媒体数据,分别对情感分析方法,事件检测模型和大选预测模型进行实验。实验结果显示,本文提出的大选预测模型可以对大选选情进行正确预测。(本文来源于《电子科技大学》期刊2017-05-17)
陈文龙[10](2017)在《基于属性融合的图挖掘算法研究》一文中研究指出随着当前互联网的快速发展,社交网络和人们日常生活的丰富,数据所呈现出来的结构也变得越来越复杂,以图模型为代表的数据类型也应运而生。这类数据不但包括对象之间的相互关系特征,也包含了数据自身的基本属性。为了从海量的图结构化数据中挖掘出有用知识,研究者开始广泛研究这种带节点属性的图的聚类技术。图聚类作为数据挖掘领域一个新的研究方向,有着重要的研究意义。目前的图聚类算法大多是基于图数据的拓扑结构或图数据的节点属性进行聚类研究的,社交网络的兴起使得这些基于单一特征的聚类算法不能满足人们日益增长的需求,存在聚类效果不理想,对实际问题建模不准确等问题。因此,挖掘图数据的知识和信息有着重要的研究价值和实际意义。本文以现有图聚类算法对数据对象建模考虑单一为切入点,提出多层属性融合模型。通过对数据建模,将数据的自身属性特征和数据之间的关系建模为不同层次特征,设置不同的层权重系数,最后经过模型融合策略,将数据自身属性特征和相互关系统一融合到一个底层网络中。通过分析,该模型融合方法能更加反映实际中的数据之间的相互关系。本文针对现有聚类算法对图结构数据聚类效果不理想的问题,提出一种基于多层属性融合的自适应权重分配(Multi-layer Attribute Fusion for the Adaptive Weight Distribution,MAFAWD)图聚类算法。算法首先建立数据对象的图结构模型,划分不同属性层和结构层,通过设置不同的属性层和结构层权重系数,使建模后的数据更能反映实际分布。然后采用仿射传播聚类算法对图数据进行聚类。为了达到理想聚类效果,最后根据节点投票机制,自适应更改属性层权重系数值,使得最后聚类结果中同一簇内各节点之间联系紧密并且具有相同属性,不同簇间连接稀疏且节点属性不同。最后,本文在真实数据集DBLP上验证MAFAWD图聚类算法。通过实验仿真设计和对聚类结果的对比评估,表明本文提出的MAFAWD图聚类算法具有良好的聚类效果。(本文来源于《电子科技大学》期刊2017-05-10)
图挖掘论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
现如今计算机软件已经涉及社会发展的各个方面,为了保证软件质量,人们更加注重软件测试。程序调试是软件测试中比较困难的任务,其中错误定位是程序调试中比较费力的一步,提升软件错误定位效率能够有效减小调试代价。因此,研究有效的错误定位方法,对提高程序调试效率,减少软件测试的成本以及保证软件的质量具有重要意义。国内外众多研究人员提出了多种软件错误分析与定位方法,然而现有方法在错误定位过程中存在忽略了一些程序执行统计信息和错误定位结果缺少错误相关上下文信息等问题。本文在分析研究了已有方法与技术的基础上,针对性地提出了基于图挖掘与支持向量机的错误定位方法和基于化学反应优化的错误定位方法,并且实现了一个基于化学反应优化的错误定位工具。针对现有方法在错误定位过程中忽略了一些程序执行统计信息的问题,本文提出了一种基于图挖掘与支持向量机的错误定位方法。该方法首先收集程序执行轨迹并建模为软件行为图;之后,约简行为图构建加权软件行为图,并且利用图挖掘算法挖掘封闭子图,记录下频繁边;最后,将软件行为图转化为特征向量,结合支持向量机对所有执行进行分类,识别分类精度明显提升的方法加入可疑方法集合进行错误定位。实验结果表明该方法能够提升分类精度,促进对错误产生根源的理解。针对现有方法提供的错误定位结果缺少错误相关上下文信息的问题,本文提出了一种基于化学反应优化的错误定位方法。该方法首先收集程序执行轨迹构建软件行为图并对其约简;然后,根据失败执行的软件行为图映射程序状态上下文信息,对上下文编码,定义分子结构利用化学反应优化算法迭代搜索最优分子种群;最后,将种群中分子解码转化为程序状态上下文进行错误定位。实验结果表明该方法能够提供执行失效相关的上下文信息,促进对程序执行失效原因的理解。在此研究的基础上,利用Java设计并实现了一个基于化学反应优化的错误定位工具FLUCRO,提供了可视化界面便于进行参数配置。综上,本文针对软件错误定位现有方法中存在的一些问题,提出了两种软件错误定位方法,同时实现了一个软件错误定位工具帮助开发人员更快地定位错误。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
图挖掘论文参考文献
[1].余平,胡玲.基于快速图挖掘的网络拓扑局部调节区域算法[J].西南师范大学学报(自然科学版).2019
[2].陆凯.基于图挖掘的错误定位方法研究[D].中国矿业大学.2019
[3].孙欢欢,郭浩,陈俊杰.面向脑网络的图挖掘及特征选择方法[J].计算机工程与设计.2018
[4].孙欢欢.面向脑网络的不确定图挖掘及特征选择方法研究[D].太原理工大学.2018
[5].尚华婷.基于多层狄利克雷过程的图挖掘主题模型[D].华东师范大学.2018
[6].陆凯,姜淑娟,王兴亚.结合图挖掘和支持向量机的错误定位[J].计算机科学与探索.2018
[7].王彦博,李金铮,杨永闳.基于图挖掘的公司业务批量获客新模式[J].金融电子化.2017
[8].崔豪驿.基于图挖掘的医疗滥用欺诈检测分析[D].山东大学.2017
[9].许乔若.基于图挖掘的推特事件关联性分析方法研究[D].电子科技大学.2017
[10].陈文龙.基于属性融合的图挖掘算法研究[D].电子科技大学.2017