导读:本文包含了程序聚类论文开题报告文献综述及选题提纲参考文献,主要关键词:R软件,teigen程序包,聚类分析,分类技术
程序聚类论文文献综述
马耀兰[1](2019)在《基于模型的聚类和分类程序包teigen在R软件中的实现》一文中研究指出teigen包实现了所有之前发布的teigen族成员以及8个额外的模型:4个多变量模型和4个单变量模型。介绍了teigen R包中的teigen()函数和plot.teigen()函数的用法,通过几何和iris数据集两个实例演示了利用teigen R包实现聚类和分类的具体步骤和评价方法。(本文来源于《牡丹江教育学院学报》期刊2019年06期)
陈颖[2](2019)在《一种面向程序理解的程序语义聚类技术》一文中研究指出针对源代码中一些非结构化的自然语言描述信息进行语义聚类,辅助开发人员开展程序理解。主要利用自然语言处理技术对程序中的标识符和注释进行预处理,将程序转换成词频矩阵;然后利用潜在语义索引技术对该词频矩阵进行层次聚类,并对每个聚类的标记进行推荐,辅助开发人员理解程序。在开源项目JEdit上进行验证,结果显示对该5万行规模的项目代码进行聚类时耗不足1分钟。因此,该技术能够快速对程序进行语义聚类,辅助开发人员快速理解程序。(本文来源于《软件导刊》期刊2019年10期)
何智恒,戴毅,柴欣生[3](2019)在《基于多变量的纸张相似性聚类分析程序与界面的设计》一文中研究指出基于PCA和K-means聚类的算法,采用LabVIEW编写了程序界面交互友好的操作软件系统,用于研究纸张在不同变量上的相似程度。程序设计主要赋予了简便操作,人机友好,数据可视化的特点。基于不同的多变量,采用PCA结合K-means聚类方法对纸张进行了相似程度的分析研究,结果表明:程序界面具有清晰简洁、交互友好、可操作性强的特点,可对纸张进行聚类分析,且可信度高。本程序可用于不同品质等级纸张在不同多变量上差异的识别和相似品质纸张的聚类,有效地进行纸张的各种差异化的分析。(本文来源于《造纸科学与技术》期刊2019年03期)
王玉森[4](2016)在《基于程序失效聚类分析的错误定位研究》一文中研究指出软件测试是软件开发和维护过程中必不可少的一个环节,也是一种重要的软件错误检测手段。随着软件的复杂化和多样化,错误定位已经成为了测试软件过程中最困难和最耗时的部分之一。因此,基于关联挖掘的软件错误定位方法成为了自动化错误定位的一个重要研究方向。它们考虑了程序代码之间的控制依赖和数据依赖,通过挖掘与失效测试相关的代码语句来进行错误定位。但是已有的这些研究都是基于程序中只包含一个错误的假设,即忽略了不同错误引起的失效测试会对同一条语句的可疑度产生迭加影响。在实际错误定位的过程中,每个程序中往往包含多个错误且错误的数量无法预知。因此在程序中含有多个错误的情况下,如何划分错误空间将多错误定位问题转化为单错误定位问题,并改进关联挖掘错误定位模型来提高错误定位的准确性和错误定位效率成为本文研究的重点问题。针对该问题,本文从失效的角度出发,并对失效聚类以及代码覆盖信息的关联关系进行了深入的研究,引入失效聚类分析实现多错误定位的同时改进了关联挖掘的错误定位模型,研究内容主要包括以下几个方面:(1)提出了基于程序失效聚类分析的多错误定位方法,对不同错误引起的失效进行聚类,分别统计各失效簇内代码语句的可疑度,避免了多个错误引起的失效测试产生迭加影响,从而提高软件中代码可疑度统计结果的准确性。(2)针对关联挖掘的错误定位模型中的局限性,提出根据失效簇中代码的函数嵌套调用复杂度,分别以基本块或行为索引建立程序执行覆盖信息对应的覆盖向量和覆盖矩阵,优化了求解频繁集合的算法,从而提高软件中错误定位的准确度。(3)以SIR基准程序为测试对象进行实验,在包含2~5个错误的程序中,验证了基于程序失效聚类分析的方法较当前流行的Tarantula、Ochiai和Jaccard方法定位更加准确,错误定位效果也有了进一步的提高。此外还分析了该方法的时间复杂度以及空间复杂度。(本文来源于《浙江理工大学》期刊2016-12-25)
张丹青,江建慧,陈林博[5](2014)在《一种对程序故障行为和失效行为的聚类有效性验证方法》一文中研究指出分析软件自身故障在软件运行过程中的行为规律是分析"故障—错误—失效"链式效应的基础.但在研究软件故障行为特征时面临的关键问题是故障行为集合的庞大与复杂.因此,如何约简故障行为集合是研究故障行为规律的基本前提."当两个程序具有相似的基本属性时,其故障行为和失效行为也具有相似性"这一推断为约简故障集提供了良好的依据,但尚未得到验证.本文核心工作即验证该推断的正确性.为此,首先提出一种针对程序基准行为、故障行为和失效行为的表征方法;其次提出一种考虑最佳聚类数的程序行为聚类方法;最后设计一组基于故障注入的程序行为聚类实验,用以验证前述推断的正确性.其中,实验分别以计算密集型程序(SPEC CPU2000和SPEC CPU2006基准程序)和I/O密集型程序(IOZONE、DEBENCH等)作为目标程序集.实验结果表明,(1)程序行为的表征方法和聚类方法具有合理性和有效性;(2)以程序基准行为聚类结果为依据的故障行为和失效行为的聚类质量良好,以此验证了推断的正确性.(本文来源于《中国科学:信息科学》期刊2014年10期)
张扬,陈亮,张番栋[6](2013)在《一种基于聚类的情报分析程序的设计与实现》一文中研究指出聚类是一种根据数据相似度对海量数据进行"无监督"分类的信息处理技术。针对当前公安情报工作"数据丰富,知识贫乏"的现状,本文提出了一种基于聚类DBSCAN算法的情报分析程序,以某地市"两抢一盗"案件数据样本为例,测试了该程序在治安防范实践中的有效性,并与数字地图相结合,为预防多发性刑事案件提供了可视化的决策支持。(本文来源于《情报杂志》期刊2013年08期)
姚艳玲[7](2013)在《基于执行路径聚类的程序错误定位方法研究》一文中研究指出软件作为计算机的灵魂一旦发生故障,就会影响正常工作,可能造成巨大损失,甚至威胁人们的生命财产安全。程序错误是导致软件故障的主要原因,自动、快速、准确地定位到程序错误可以有效地提高软件可靠性。近年来,程序错误定位技术取得了很大的成果,其中基于测试的错误定位技术(TBFL)是一种利用测试覆盖信息进行错误定位的智能方法。该方法需要运行大量的测试用例收集信息,冗余大,且当计算方法对测试用例敏感时定位效果不佳。在前人研究的基础上,本文针对主流方法存在的局限性,提出了将FCM聚类算法运用到程序执行路径的处理上。该方法首先利用LOUPE工具收集所有测试用例的程序执行状态信息trace文件;然后使用MATLAB解析trace文件并用多值向量表示程序执行路径;在FLOC通用框架的基础上,利用聚类算法组织程序执行路径信息,使用FCM算法把大量相同或相似的执行路径覆盖信息划分为少量典型的执行路径覆盖信息,将聚类后的执行路径作为程序错误定位的数据集;最后利用差异对比的方法或结合现有的差异计算方法进行错误定位。本文用引入FCM聚类算法的错误定位方法对Siemens套件进行了大量实验,并与Tarantula、SOBER、SBI算法进行了对比。实验表明,利用该方法可以减小对测试用例的敏感度,使用少量的测试用例可以达到大量测试用例相同的定位效果,减少了路径冗余,提高了定位效果。(本文来源于《大连海事大学》期刊2013-05-01)
王超,徐肖豪,王飞[8](2013)在《基于航迹聚类的终端区进场程序管制适用性分析》一文中研究指出为了定量评估终端空域的空中交通管制服务水平,提出了描述进场飞行程序管制适用性的新概念。在对实际运行航迹数据特征分析的基础上,建立了基于对应雷达轨迹点逆向比对方法的航迹间相似性测度模型。应用层次聚类法对航迹数据集进行了聚类分析,提出了根据航迹聚类集构造平均航迹的方法。通过比较平均航迹和标准进场程序,建立了描述管制适用性的3个量化指标及其算法,包括:纵向偏离度、侧向偏离度和非常规航迹比例等。实例分析表明:以上指标能准确表示进场飞行程序提供空中交通管制服务的水平,并可以根据聚类结果来改进现有进场飞行程序结构。(本文来源于《南京航空航天大学学报》期刊2013年01期)
朱天梅[9](2012)在《基于程序聚类的软件模块化质量演化监控技术研究》一文中研究指出随着软件系统的演化,系统的模块化结构会逐渐偏离其最初设计,并且这种偏离的不断积累通常会降低软件的可维护性,损害软件的整体质量,甚至使软件更容易引入缺陷或错误,进而导致严重的软件灾难。因此,如何客观地评价软件系统的模块化质量,以及如何发现和改正软件模块化结构中可能存在的问题,已经成为一个非常重要的研究课题。本文讨论了持续监控软件系统模块化质量演化状况的方法,帮助项目管理者更及时、全面地掌握软件系统的演化现状,同时还探讨了分析软件模块重构风险的方法,该方法可以帮助维护者更具针对性地进行系统维护。观察软件模块结构的角度有很多,每个角度所关注的内容各不相同。不同模块化视图之间的一致性越高,往往预示软件的可维护性也更高。因此,软件演化过程中各种模块化视图之间的偏离程度,是估计软件模块化质量的重要线索。本文中我们考虑了叁种模块化视图,即:包结构视图、语义聚类视图、以及结构聚类视图,并尝试通过比较各种模块化视图之间的差异,对软件模块化质量进行评估。通过采用基于分散度的方法可以分析系统中各个模块的重构风险。对演化中的软件系统进行持续的模块化质量评估,还可以尽早发现软件演化过程中可能存在的模块化质量问题,甚至预测软件模块化质量的演化趋势。为了验证本文方法的有效性,我们在叁个开源软件项目的124个演化版本上进行了实验。通过与传统的模块度量方法进行比较,表明采用本文方法获得的重构风险预测结果与实际重构活动有较好的吻合度,从而证实了该方法的有效性。另外,我们通过使用历史演化数据重现软件的演化过程,以实际发生的演化行为和相关记录作为预测结果的评判标准,最终也证实了本文所提模块化质量监控方法和演化模式的合理性。(本文来源于《复旦大学》期刊2012-04-20)
谭曦[10](2012)在《基于程序聚类的软件缺陷预测方法研究》一文中研究指出软件质量保证是软件工程中重要的环节,通过建立一系列有计划、有系统的保证方法,对软件产品质量进行评估和审计,以向客户或管理层提交完善的软件产品。然而由于项目进度以及成本控制等原因,对于软件质量保证往往无法提供充足的时间、人力及财力,导致所提交的软件产品往往可能包含缺陷或错误。软件中的缺陷或错误往往会导致软件运行中出现错误,进而可能导致严重的软件灾难。针对软件缺陷的侦测与改正,目前已有一系列研究。其中,通过经验分析建立缺陷预测模型被证明是一种有效的方法。通过对已有的软件产品或软件开发过程度量值与缺陷数据进行经验分析,建立缺陷预测模型对软件缺陷进行预测,从而帮助软件开发人员更有效地进行软件质量保证及测试工作。本文的研究主要关注于软件缺陷预测模型,尤其是基于软件产品度量值的缺陷预测模型。之前的研究主要是基于类或文件级别的度量值进行缺陷预测并尝试提高预测效果,部分研究者提出了基于更高层次的软件单元(组件或包)进行缺陷预测。研究表明,基于更高层次的缺陷预测模型能够得到更高的预测召回率和准确率,但当工作量因素被考虑时,这种预测模型的表现会变差。在本文中,我们结合程序聚类,提出了一种基于程序聚类结果的软件缺陷预测模型方法。我们尝试使用更具有问题域信息的代码聚类作为缺陷预测的单元,以提高缺陷预测的效果,尤其是在工作量模型中的预测效果。为了验证本文方法的有效性,我们在Eclipse3.0系统上进行了实验。我们使用不同的方法、基于程序聚类建立缺陷预测模型进行预测,并与传统的基于类的预测模型进行比较。通过比较,我们发现基于程序聚类建立的预测模型,在预测的召回率和准确率上都有很大提高,同时,在工作量模型中,基于聚类的缺陷预测模型的结果也有一定改善。(本文来源于《复旦大学》期刊2012-04-20)
程序聚类论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对源代码中一些非结构化的自然语言描述信息进行语义聚类,辅助开发人员开展程序理解。主要利用自然语言处理技术对程序中的标识符和注释进行预处理,将程序转换成词频矩阵;然后利用潜在语义索引技术对该词频矩阵进行层次聚类,并对每个聚类的标记进行推荐,辅助开发人员理解程序。在开源项目JEdit上进行验证,结果显示对该5万行规模的项目代码进行聚类时耗不足1分钟。因此,该技术能够快速对程序进行语义聚类,辅助开发人员快速理解程序。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
程序聚类论文参考文献
[1].马耀兰.基于模型的聚类和分类程序包teigen在R软件中的实现[J].牡丹江教育学院学报.2019
[2].陈颖.一种面向程序理解的程序语义聚类技术[J].软件导刊.2019
[3].何智恒,戴毅,柴欣生.基于多变量的纸张相似性聚类分析程序与界面的设计[J].造纸科学与技术.2019
[4].王玉森.基于程序失效聚类分析的错误定位研究[D].浙江理工大学.2016
[5].张丹青,江建慧,陈林博.一种对程序故障行为和失效行为的聚类有效性验证方法[J].中国科学:信息科学.2014
[6].张扬,陈亮,张番栋.一种基于聚类的情报分析程序的设计与实现[J].情报杂志.2013
[7].姚艳玲.基于执行路径聚类的程序错误定位方法研究[D].大连海事大学.2013
[8].王超,徐肖豪,王飞.基于航迹聚类的终端区进场程序管制适用性分析[J].南京航空航天大学学报.2013
[9].朱天梅.基于程序聚类的软件模块化质量演化监控技术研究[D].复旦大学.2012
[10].谭曦.基于程序聚类的软件缺陷预测方法研究[D].复旦大学.2012