导读:本文包含了程序代码抄袭检测论文开题报告文献综述及选题提纲参考文献,主要关键词:抄袭检测,相似度,Winnowing算法,结构度量
程序代码抄袭检测论文文献综述
杨超[1](2016)在《基于多种技术的混合式程序代码抄袭检测方法》一文中研究指出在分析现有程序代码抄袭检测系统的特点及局限性的基础上,提出一种综合文本分析、结构度量和属性计数技术的混合式程序抄袭检测方法。应用文档指纹技术和Winnowing算法计算程序的文本相似度;将程序代码表示成动态控制结构树(Dynamic Control Structure tree,DCS),运用Winnowing算法计算DCS树相似度,从而得到结构相似度;收集并统计程序中的每个变量信息,应用变量相似度算法分析变量信息节点获取变量相似度;分别赋予文本相似度、结构相似度和变量相似度一个权值,计算得到总体的代码相似度。实验结果表明,所提出的方法能够有效检测出各种抄袭行为。针对不同的抄袭门槛值,使用该方法的检测结果准确度和查全率高于JPLAG系统。特别对于结构简单的程序组,此方法和JPLAG系统检测结果的平均准确度分别为82.5%和69.5%,说明所提的方法更加有效。(本文来源于《计算机工程与应用》期刊2016年18期)
曹海英,元元[2](2015)在《程序代码抄袭检测中串匹配算法的研究》一文中研究指出为了保证程序设计课程实践教学质量,避免学生抄袭,可以检测学生的源程序,代码的相似度是抄袭检测的关键技术。文章介绍了一种串匹配算法——GST算法,包括GST算法的核心思想以及伪代码实现。(本文来源于《信息安全与技术》期刊2015年02期)
单树倩[3](2012)在《基于UML的C语言程序代码防抄袭检测系统的研究与实现》一文中研究指出程序代码的相似性检测是利用一定的相似性检测技术,采用合适的算法度量两个程序代码之间的相似程度。UML(Unified Modeling Language)统一建模语言,是一个支持模型化的图形化语言,为软件开发各个阶段提供模型化和可视化支持,并对任何具有静态结构和动态行为的系统进行结构与行为建模。C语言是目前国内外各大高校开设的学习计算机编程技术最流行的一门公共基础课,教学过程中发现有些学生抄袭程序,研究如何避免该现象的发生,是建立良好学风的重要内容。本文通过分析相似程序的类型、特点,重点研究程序代码的相似性检测方法和相似度评价标准,并结合C语言的语法、属性和结构特点,采用面向对象的方法,并通过UML进行建模,利用C++语言和Visual C++6.0环境开发了C语言防抄袭检测系统。该系统主要采用属性计数与结构度量相结合的思想进行相似代码的检测,提取待比较程序的四十个属性值,并利用卡方检验获得属性相似度,同时采用最长公共子序列(Longest Common Subsequence,LCS)算法和GreedyString Tiling (GST)两种算法分别计算源程序在结构上的相似性。实验结果证明LCS算法比GST算法获得较好相似性比较结果。本系统界面简洁友好、操作简单,相似度检测结果清晰,便于应用。(本文来源于《华北电力大学》期刊2012-12-01)
吴斐[4](2012)在《基于N-gram的程序代码抄袭检测方法研究》一文中研究指出信息网络的飞速发展及电子文档的广泛使用给我们的生活带来了巨大的影响,一些影响有利于我们生活的方向发展,而一些影响却给我们的生活以及技术本身的发展带来了负面作用。相比于传统文件,电子文档更容易被非法复制和抄袭,程序代码抄袭现象已经十分严重。为了维护高校正常教学秩序,保护软件知识产权,抑制抄袭现象的不断蔓延,程序代码抄袭检测技术及应用的研究具有重要意义。目前程序源代码袭检测研究领域中比较有效的源代码抄袭检测系统有JPLAG,YAP3和MOSS系统,但现有的抄袭检测系统的检测准确率还有待提高,且难以处理大规模数据。针对程序代码抄袭检测准确率问题,本文提出一种基于N-gram的程序代码抄袭检测算法,利用N-gram表示待检测程序代码文本,将程序代码文本转化成N-gram集合,统计N-gram的出现频度,将N-gram集合和频度放入向量空间中进行相似度计算,这样可以保留程序代码的结构信息和语义信息,提高程序代码抄袭检测的检测准确性。本文以美国圣约翰大学采集的5136个学生VB程序作业为数据集与MOSS系统进行对比实验,实验结果证明基于N-gram的程序代码抄袭检测算法的检测准确率比MOSS系统有了一定的提高。针对程序代码抄袭检测效率问题,本文采用基于Fork/Join框架的并行算法来优化检测算法,因为Fork/Join并行计算框架具有良好的线程控制机制,很好地处理了线程之间存在的饥饿、竞争和死锁等问题,十分适合小任务、大数据量的并行计算问题,且本文检测算法需要进行n*(n+m-1)/2次相似度计算,属于大规模数据处理,且不同文本间的相似度计算是独立的任务,具有可并发性,所以本文检测算法十分适合采用Fork/Join并行计算框架进行并行化处理。实验结果证明,经过基于Fork/Join框架的并行算法优化后,检测算法的检测效率得到了明显提高。(本文来源于《西南大学》期刊2012-04-15)
赵彦博[5](2010)在《基于抽象语法树的程序代码抄袭检测技术研究》一文中研究指出抄袭是当前普遍存在的现象。近年来,该现象愈演愈烈,手段越来越隐蔽,有些人甚至对抄袭习以为常。在高等教育领域,因计算机类专业工程实践性的特点,要求众多课程围绕计算机进行实践教学与考核,而计算机上电子文本更易被复制及传播。国外有研究者曾针对澳大利亚蒙纳什(Monash)大学的程序设计类课程中程序代码抄袭现象进行调查,统计显示:高达85.4%的学生承认抄袭过他人的作业。这些问题的存在,已严重影响到学生能力的培养与教师正常教学的进行。程序代码抄袭检测技术能够高效快捷地发现有抄袭嫌疑的程序代码,有助于扼制学生不良学风的形成,保证教学质量与客观评价。本文就目前国内外现有程序代码抄袭检测技术进行了研究分析,提出了基于抽象语法树的程序代码抄袭检测方法。基本思路:借助GCC编译器为每一源程序分别构造抽象语法树,程序代码所包含的语义可以被解析至抽象语法树的各个结点中;由于抽象语法树包含许多有助于编译的细节信息,进而优化抽象语法树的结构关系,消除冗余结点,提取与程序有关的可用结点;之后进行可用结点解析,生成特征标记串文本,该标记特征串文本不再是一个线性串,而是一个含有丰富程序语义信息的结点集合;最后利用决策函数对特征标记串集进行相似性计算,完成代码检测。为了有效判定存在抄袭的程序对,还设定了相似性阈值自适应选取机制。在上述理论研究的基础上,设计并实现了一个基于抽象语法树的程序代码抄袭检测实验系统,该实验系统能够自动完成抽象语法树优化、结点解析和抄袭检测。以C语言程序代码为测试数据,并与MOSS系统的检测结果进行对比验证。实验表明,基于抽象语法树检测技术的上述试验系统,能够有效检测含有函数调用的复杂程序结构,并具有多种抄袭手段的程序代码。(本文来源于《内蒙古师范大学》期刊2010-03-30)
王春晖[6](2008)在《程序代码抄袭检测中串匹配算法的研究与实现》一文中研究指出学生程序作业的抄袭严重影响了教学效果,检测出抄袭的作业并对存在抄袭的学生进行适当的惩罚,在一定程度上可以降低抄袭的发生次数,进而提高学生程序设计类课程的学习效果,激发学生的学习热情。如果程序作业抄袭检测通过人工来完成,可见找出存在抄袭嫌疑的作业对象是一件繁琐、低效的工作。应用程序代码抄袭检测系统可以实现程序代码抄袭的自动检测,为教师判定抄袭提供辅助,可以有效的减轻教师的工作量。除此之外,该项技术还可以应用在软件的版权鉴定以及软件的版本判定等方面。本文首先介绍了有关程序代码抄袭检测技术的相关理论,包括程序代码抄袭检测的实现过程、关键技术、检测效果以及一些现有的抄袭检测系统。并对应用程序抄袭检测系统检测学生程序作业抄袭的可用性进行了相关的探讨。串匹配算法是程序代码抄袭检测中标记匹配的重要算法,程序代码的编写特点决定了标记匹配结果不应该受模式串的长度及标记位置等因素的影响,而传统的模式匹配无法准确解决这个问题。因此,本文主要研究了适用在程序代码抄袭检测中的串匹配算法,通过分析几种抄袭检测系统中标记匹配算法,包括动态程序设计方法、Heckel算法、GST算法,总结了它们应用在抄袭检测中的优点与不足,并对其中较为高效的串匹配算法-GST算法及其改进算法RKR-GST算法进行研究与实现。最后本文对GST及RKR-GST算法的实现程序进行了相关实验,通过实验结果分析及实例演示表明该算法对于程序标记匹配过程适用。(本文来源于《内蒙古师范大学》期刊2008-04-15)
程序代码抄袭检测论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为了保证程序设计课程实践教学质量,避免学生抄袭,可以检测学生的源程序,代码的相似度是抄袭检测的关键技术。文章介绍了一种串匹配算法——GST算法,包括GST算法的核心思想以及伪代码实现。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
程序代码抄袭检测论文参考文献
[1].杨超.基于多种技术的混合式程序代码抄袭检测方法[J].计算机工程与应用.2016
[2].曹海英,元元.程序代码抄袭检测中串匹配算法的研究[J].信息安全与技术.2015
[3].单树倩.基于UML的C语言程序代码防抄袭检测系统的研究与实现[D].华北电力大学.2012
[4].吴斐.基于N-gram的程序代码抄袭检测方法研究[D].西南大学.2012
[5].赵彦博.基于抽象语法树的程序代码抄袭检测技术研究[D].内蒙古师范大学.2010
[6].王春晖.程序代码抄袭检测中串匹配算法的研究与实现[D].内蒙古师范大学.2008
标签:抄袭检测; 相似度; Winnowing算法; 结构度量;