软件聚类论文-李慧敏

软件聚类论文-李慧敏

导读:本文包含了软件聚类论文开题报告文献综述及选题提纲参考文献,主要关键词:特征提取,恶意软件,聚类

软件聚类论文文献综述

李慧敏[1](2019)在《基于OPTICS算法的恶意软件聚类方法研究》一文中研究指出新增恶意软件呈暴涨趋势,已达上亿级别,但是多数恶意软件是"新瓶装旧酒",通过多态变种、加壳等技术手段改头换面,对计算机系统构成严重安全威胁。提出一种恶意软件聚类方法,将恶意代码的行为特征转化为特征向量,采用NCD衡量恶意软件行为特征之间的相似度,利用OPTICS算法对恶意软件进行聚类分析,聚合成具有相似特征的家族,将聚类后的结果与人工标记的结果进行分析比较,实验结果表明该方法对恶意软件聚类的识别率较高。(本文来源于《长春工程学院学报(自然科学版)》期刊2019年02期)

刘彦宇,包东辉[2](2019)在《一种基于模块依赖图属性的软件聚类算法》一文中研究指出开源程序、遗产系统在程序理解过程中,使用软件聚类技术来提取软件系统架构,以降低理解和分析软件系统的难度。目前主流算法当中,层次聚类算法虽具有合理的搜索时间,但聚类结果无法令人满意,基于搜索的算法虽有良好聚类结果,但时间和空间限制使它们无法应对大型软件系统。针对现有软件聚类方法的局限性,提出了一种新的确定性聚类算法,利用模块依赖图(MDG)中现有属性进行聚类。初步结果显示,与层次聚类算法和基于搜索的算法相比,该算法在合理的时间内能够较好地获取聚类结果。所提出的聚类算法可以有效地帮助软件设计师从源代码中提取良好的子系统。(本文来源于《河池学院学报》期刊2019年02期)

肖锦琦,王俊峰[3](2018)在《基于模糊哈希特征表示的恶意软件聚类方法》一文中研究指出目前,每年被拦截到的新型恶意软件变种数已达千万级别,在线恶意软件仓库Virus Share上存储的未分类的恶意软件数量也超过了2700万.将恶意软件按一定的行为模式进行聚类,不仅使新型攻击更易被检测出来,也有助于及时获取恶意软件的发展态势并做出防范措施.因此提出了一种高效的恶意软件聚类方法,对恶意样本进行动态分析并筛选出包括导入、导出函数、软件字符串、运行时资源访问记录以及系统API调用序列等特征,然后将这些特征转换为模糊哈希,选用CFSFDP聚类算法对恶意软件样本进行聚类.并将聚类个数、准确率、召回率、调和平均值以及熵作为聚类效果的外部评估指标,将簇内紧密度以及簇间区分度作为内部评估指标,实验结果表明,与Symantec和ESET-NOD32的分类结果相比,本文提出的方法的聚类家族个数与人工标记的数量最为接近,调和平均值分别提升11.632%,2.41%.(本文来源于《四川大学学报(自然科学版)》期刊2018年03期)

钟林辉,李俊杰,张能伟,黄小明[4](2015)在《基于演化依赖的Java软件聚类实现技术研究》一文中研究指出传统的软件聚类方法没有考虑软件实体间存在一些无法通过静态分析手段获取的关系(即演化依赖关系),这将导致聚类后的软件可能不符合"高内聚、低耦合"特征.为了解决上述问题,提出了将软件演化信息纳入软件聚类过程的策略,并在扩展的Java依赖模型的基础上,实现了一个基于模拟退火的软件聚类算法.实验结果表明:该方法能达到提高软件聚类准确度的目的.(本文来源于《江西师范大学学报(自然科学版)》期刊2015年04期)

张能伟[5](2015)在《基于扩展依赖关系模型的Java软件聚类研究》一文中研究指出软件工程实践表明,软件的结构若能够符合“高内聚、低耦合”的设计特征,不仅能将因软件变化所引起的波动效应控制在较小的范围内,而且能减少后期软件维护的成本。然而,软件的设计是一个复杂的过程,软件开发者往往缺乏对问题领域的深入理解,因此软件的早期设计并不能完全符合“高内聚、低耦合”的设计特征。此外,软件的实现代码和软件设计文档可能出现不一致的情况,需要有一种方法能从实现代码中逆向导出软件结构,以验证是否与软件设计一致。本文的研究目标是从Java程序源代码中逆向导出软件结构,并且验证其是否符合高内聚、低耦合的软件特征。主要研究内容包括:1、从多个版本的源代码中获取Java类共同变化的关系,将Java类共同变化的关系映射为软件演化属性信息;2、使用软件演化属性信息建立扩展的依赖关系模型;3、基于扩展的依赖关系模型实现软件聚类;4、设计并实现基于上述的系统。基于上述研究目标和内容,本文提出了基于扩展的依赖关系模型的Java聚类方法。首先,介绍了扩展的依赖关系模型以及如何构建扩展的依赖关系模型。通过Java类共同变化获取软件演化属性信息,再在原始的依赖关系模型基础上添加了软件演化属性信息构成扩展的依赖关系模型。构建扩展的依赖关系模型主要步骤包括:获取实体属性集、Java类共同变化的提取、实体间相似度计算等。其次,详细介绍了基于扩展的依赖关系模型的软件聚类,并且描述了针对未扩展的依赖关系模型和扩展的依赖关系模型两种情况下进行软件聚类的实验过程。最后,描述了系统的设计和实现。文中创新点包括:1、基于关联规则算法挖掘Java类共同变化这类演化信息,并在此基础上构建扩展的依赖关系模型;2、基于扩展依赖关系模型的软件聚类;3、设计并实现一个针对上述模型进行软件聚类的系统。(本文来源于《江西师范大学》期刊2015-06-01)

徐晓旻[6](2013)在《基于图聚类的多维数据和软件聚类研究》一文中研究指出聚类作为一种无监督的模式分类方法,在语音识别、字符识别以及数据挖掘(多关系数据挖掘)、时空数据库应用(GIS等)、序列数据分析等领域具有广阔的应用前景。聚类研究按照数据建模方式可分为多维空间上的聚类以及图聚类(又称为图上社团发现)两个主要方向。随着各类数据规模持续增长,如何对海量的数据进行高效和有效的聚类分析是成为对多维数据的聚类研究一个巨大挑战。而对于图上的聚类而言,图聚类的特定的应用背景以及其可视化的过程需求的多样性是当前图聚类在实际应用中的主要挑战之一。针对上述挑战,本文研究了在多维数值型向量数据和软件模块图数据上运用图上聚类技术实现高效和高质量聚类的聚类算法。主要工作分为两大块。首先对多维空间上聚类所面临的处理海量数据的挑战,本文中提出了基于K-Means的KBAC算法,该算法采用K-Means算法作为预聚类过程,能够自适应确定最佳聚类核数目并进行聚类。其核心思想是将样本空间聚类问题转换为图上社团发现问题。并进一步研究了该算法在云平台上进行实现和优化方案。理论和实验证明,通过在云计算框架下优化实现K-Means预聚类过程的并行化,KBAC算法能够高效地对大规模数据进行自适应聚类,并获得高质量的聚类结果。另一方面,针对图聚类在不同应用背景下问题的多样性,本文探索了软件聚类这一领域内的图聚类。在本文中提出了基于入口和PageRank的两阶段层次聚类算法和对软件聚类输出的模块的命名算法,并探索了对软件聚类结果进行粒度可调节的动态可视化的实现。并基于上述算法的设计,开发了软件聚类工具原型SCuV。该工具从软件源代码中提取出软件模块间的调用图,采用提出的算法进行聚类并实现可视化。案例分析表明该工具的聚类效率较高,能够给出具有一定语义的软件模块层次并实现了粒度可调的可视化,具有较好的应用前景。(本文来源于《复旦大学》期刊2013-05-18)

钱冠群,张林,张莉[7](2009)在《基于复杂网络的二阶段软件聚类方法》一文中研究指出将复杂网络社区检测中的GN(Girvan-Newman)算法引入到软件聚类中,针对GN算法中存在的计算量大、可能产生小规模社区的缺陷,提出了一种二阶段聚类方法.首先基于结构模式对软件网络进行聚类.通过识别和聚类软件网络中3种常见的结构模式:卫星结构、链结构和拓扑相似结构,可以有效地减小网络规模.其次,在限制模块大小的前提下利用改进的GN算法进行聚类.如果介数最大边的删除会导致生成的社区规模小于预定值,那么放弃删除该边,转而尝试介数次大的边.实验结果表明:二阶段聚类算法可以有效地改善软件聚类效果,提高现有社区划分算法在大规模软件中的适用性.(本文来源于《北京航空航天大学学报》期刊2009年12期)

软件聚类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

开源程序、遗产系统在程序理解过程中,使用软件聚类技术来提取软件系统架构,以降低理解和分析软件系统的难度。目前主流算法当中,层次聚类算法虽具有合理的搜索时间,但聚类结果无法令人满意,基于搜索的算法虽有良好聚类结果,但时间和空间限制使它们无法应对大型软件系统。针对现有软件聚类方法的局限性,提出了一种新的确定性聚类算法,利用模块依赖图(MDG)中现有属性进行聚类。初步结果显示,与层次聚类算法和基于搜索的算法相比,该算法在合理的时间内能够较好地获取聚类结果。所提出的聚类算法可以有效地帮助软件设计师从源代码中提取良好的子系统。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

软件聚类论文参考文献

[1].李慧敏.基于OPTICS算法的恶意软件聚类方法研究[J].长春工程学院学报(自然科学版).2019

[2].刘彦宇,包东辉.一种基于模块依赖图属性的软件聚类算法[J].河池学院学报.2019

[3].肖锦琦,王俊峰.基于模糊哈希特征表示的恶意软件聚类方法[J].四川大学学报(自然科学版).2018

[4].钟林辉,李俊杰,张能伟,黄小明.基于演化依赖的Java软件聚类实现技术研究[J].江西师范大学学报(自然科学版).2015

[5].张能伟.基于扩展依赖关系模型的Java软件聚类研究[D].江西师范大学.2015

[6].徐晓旻.基于图聚类的多维数据和软件聚类研究[D].复旦大学.2013

[7].钱冠群,张林,张莉.基于复杂网络的二阶段软件聚类方法[J].北京航空航天大学学报.2009

标签:;  ;  ;  

软件聚类论文-李慧敏
下载Doc文档

猜你喜欢