导读:本文包含了样本约简论文开题报告文献综述及选题提纲参考文献,主要关键词:入侵检测,聚类,属性约简,样本选择
样本约简论文文献综述
杨文君[1](2017)在《基于模糊聚类的样本选择约简算法在入侵检测技术中的应用》一文中研究指出为提高入侵检测的检测率,降低误检率,结合半监督方法和模糊聚类的样本选择属性约简的入侵检测方法,对数据预处理之后,利用半监督模糊聚类选择样本,再对样本进行基于属性依赖度的约简。利用KDD99数据集仿真实验,结果表明,检测效率有了很大提高。(本文来源于《科学技术创新》期刊2017年33期)
程汝峰,梁永全,刘彤[2](2017)在《一种适用于不同分类器的样本约简算法》一文中研究指出现有的样本约简算法多数是针对某种分类器设计的,在实际应用中有一定的局限性。结合聚类算法的思想,设计了一种适用于不同分类器的样本约简算法,核心是选取密度高且距离相对较远的样本点。与其他样本约简算法相比较,该算法可以根据需求获得任意大小的样本子集,并适用于多种分类算法;而对包含噪声点的样本集,算法的分类精度和稳定性均有一定程度的提高。(本文来源于《山东科技大学学报(自然科学版)》期刊2017年03期)
张国栋,肖娅,周炬,郭薇[3](2016)在《一种支持向量机的样本约简方法》一文中研究指出支持向量机算法求解会涉及矩阵的存储与运算,因此算法的时空复杂度较大,这些不足之处限制了支持向量机的应用。为提高支持向量机的训练速度,缩短训练时间,提出一种样本约简方法。该方法通过两次样本约简,剔除掉大部分非边界样本,保留少数且有效的样本作为训练集。然后,采取KNN算法去除约简后训练集中的孤立点和噪音点。最后,对UCI标准数据集中的Breast-Cancers数据进行实验,支持向量减少了25个,训练时间减少了7 ms,而准确率却得到了提高。实验结果表明,在保证预测精确度的前提下,该算法能够有效进行样本约简,缩短训练时间。(本文来源于《沈阳航空航天大学学报》期刊2016年03期)
杨习贝,颜旭,徐苏平,于化龙[4](2016)在《基于样本选择的启发式属性约简方法研究》一文中研究指出属性约简是粗糙集理论的核心研究内容之一。借鉴于贪心策略的启发式算法是求解约简的一种有效技术手段。传统的启发式算法使用了决策系统中的所有样本,但实际上每个样本对约简的贡献程度是不同的,这在一定程度上增加了启发式算法的时间消耗。为解决这一问题,提出了一种基于样本选择的启发式算法,该算法主要分为3步:首先从样本集中挑选出重要的样本;然后利用选取出的样本构建新的决策系统;最后利用启发式算法求解约简。实验结果表明,新算法能够有效地减少约简的求解时间。(本文来源于《计算机科学》期刊2016年01期)
李栋,刘树林,张宏利[5](2015)在《基于约简边界样本界面检测器的设备异常度检测方法》一文中研究指出针对在无故障样本情况下如何快速检测设备异常度问题,在约简自己空间边界样本数量的基础上,提出一种约简边界样本界面检测器。以Iris数据集为例进行分析,发现与已有的异常检测方法相比,约简边界样本界面检测器是一种具有高检测率高误报警率的异常检测方法,而且具有很强的数据压缩功能,尤其是在区分有较清晰类边界数据时,具有更好的检测性能。利用约简边界样本界面检测器异常检测方法分析轴承状态数据,不仅能反映出轴承的各种状态,而且能通过设备的异常程度反映出同类故障的轻重程度。约简边界样本界面检测器的设备异常度检测方法,是在学习设备正常运行数据的基础上,找到自己空间的边界样本,并根据一定规则将其约简后,结合其方位信息与训练样本半径,进行设备状态检测,不需要设备运行的故障数据,它适合对故障数据缺乏的设备进行有效的异常检测。(本文来源于《机械工程学报》期刊2015年16期)
梁海龙[6](2015)在《基于邻域粗糙集的属性约简和样本约减算法研究及在文本分类中的应用》一文中研究指出科学技术和社会经济的飞速发展,各个领域的数据急剧增加,为了从海量的数据中提炼出对人们有用的信息,需要对数据进行处理,进而达到信息的有效利用。在分类方法的学习过程中,数据集中的样本往往是大量的,并非所有的样本及其属性对分类器都有贡献,有些样本或属性甚至会降低分类器的分类精度。约减掉这些样本和属性,不但能够缩短分类时间,提高分类效率,而且能够节省存储空间。因而,研究数据的属性约简和样本约减是进行数据分类之前的重要研究内容,具有十分重要的理论意义。邻域粗糙集模型的提出扩展了经典粗糙集理论,克服了经典粗糙集只能处理符号型的数值属性的不足。邻域粗糙集模型不仅能够处理符号型数值属性,也能处理连续型数值属性,具有重要的现实应用意义。本文借鉴邻域粗糙集的基本思想,改进了基于正域的属性约简算法只考虑被正确区分样本数的不足,并且分析了样本约减过程中样本空间中样本的分布不均匀对分类精度的影响。本文的主要创新点有:(1)定义了区分对象集的概念,并探讨了其基本性质,进而提出了基于区分对象集的属性重要度度量。传统的基于正域的属性约简算法是利用正域的思想,仅考虑被正确区分样本数的约简算法。本文借鉴边界域的思想,提出了区分对象集的概念。(2)根据(1)所提,设计了改进的基于邻域粗糙集的启发式属性约简算法。该约简算法在处理信息决策表的属性时,既考虑信息决策表的相对正域,也考虑以核属性为启发信息逐个增加条件属性时对边界域样本的影响。当增加某一属性时,若能引起边界域样本数变化最大,则该属性对决策表的影响最大,从而实现信息决策表的属性约简。(3)在(2)中所提属性约简的基础上进行样本约减。鉴于类别的分布密度对样本约减影响很大,本文提出了一种基于密度的邻域模型样本约减方法,即依据样本的分布密度对其进行约减。应用邻域模型对最大密度差类别内样本进行约减,选取邻域样本数最多的样本,将其保留到约减后的样本集中,该样本邻域内的其他所有样本都被删掉,从而去除原样本集最大密度差类别内多余样本,使类别内样本分布更加均匀。(4)将本文所提的属性约简和样本约减算法应用于中文文本分类。由于中文文本无法直接处理,需要建立相应的文本分类预处理过程,以便用邻域粗糙集理论的相关概念进行处理。以复旦大学的中文文本语料库为实验对象进行实验,实验结果表明,改进的属性约简算法能够很好的减少文本的特征词,样本约减算法能够减少文本数,通过这两种算法,很好的降低训练文本集的维度并应用于文本分类,进而可以帮助用户迅速准确地获取所需知识信息,具有一定的实际意义和现实应用。(本文来源于《太原理工大学》期刊2015-05-01)
袁辉,王凤山,许继恒,沈英[7](2014)在《基于改进SVM的坑道毁伤仿真训练样本约简模型》一文中研究指出针对坑道工程动荷段毁伤仿真科学实验训练样本中存在的相似样本和大量对分类器模型构造"无用"的冗余信息,提出了一种基于改进支持向量机的动荷段毁伤仿真实验训练样本约简方法。围绕约简任务和功能约束,设计坑道工程动荷段毁伤仿真实验训练样本约简分析机制,利用支持向量机结构风险最小化原则和非线性映射特性以及粒子群的快速全局优化特征,学习坑道工程动荷段毁伤仿真实验训练样本,快速建立训练样本的约简分类器,排除负类训练样本,为坑道动荷段毁伤评估提供优质的训练样本。算例表明,模型具有良好的收敛和精度。(本文来源于《解放军理工大学学报(自然科学版)》期刊2014年02期)
杜敏杰,蔡金燕[8](2013)在《基于样本约简的实时SVDD算法与电路故障检测应用》一文中研究指出针对支持向量数据描述(SVDD)训练大规模样本时计算复杂度太大的问题,提出了一种基于样本约简的实时SVDD算法.该算法首先通过随机抽样的方法从原始样本集中抽取一定规模样本用于SVDD训练;然后用训练得到的支持向量对特征空间中的样本中心进行估计;最后计算原始样本集中所有样本到中心的距离,并对所有距离按降序排列,通过提取一定比例距离较大的样本作为训练样本集对SVDD进行训练,最终实现了训练样本规模约简.实验结果表明:算法有效削减了训练复杂度,满足了SVDD故障检测的实时性要求.(本文来源于《微电子学与计算机》期刊2013年07期)
李奇[9](2013)在《基于复杂网络的约简LSSVM样本筛选及其应用》一文中研究指出随着科技的发展,现实中越来越多的数据被收集存储到数据库中,机器学习被用来挖掘数据中蕴藏的有用信息。基于数据的建模方法中当训练集样本个数变为海量时,其计算过程的时间复杂度和空间复杂度将大大提高。虽然约简支持向量机通过随机缩小样本集规模以减少支持向量的个数,并提高了计算速度,但在解决很多实际问题时,这种随机的约简训练集可能导致样本中一些有用的信息丢失,降低了所建模型的泛化性能和精度。本文提出了一种基于复杂网络建模的样本筛选方法用于约简最小二乘支持向量机模型。该复杂网络模型首先构造数据样本,计算样本间距离,得到表示网络的邻接矩阵和样本集。通过以模块度最大化为优化目标,在样本节点的复杂网络中进行社区发现,获得对应问题不同情况下的样本社区聚类。由于现实数据采集问题会出现异常点,根据制定的规则剔除异常点社区,并计算每个样本节点的结合度,将结合度大的典型样本构成训练集,提高泛化性能并尽可能的保留原有样本集中的有用信息实现样本集的约简,从而建立了约简最小二乘支持向量机模型。为表明本文所提方法的有效性,将本文提出的方法与不同聚类筛选样本方法进行对比。采用某钢铁企业实际高炉煤气系统实时流量预测问题进行了仿真实验,其结果表明,本文提出的样本筛选方法克服了普通聚类筛选的盲目性和随机性,剔除异常点数据,有效去除样本冗余,大大提高了训练样本集的典型性,使得简约最小二乘支持向量机模型具备较高的精度和较小的计算复杂度,有效提高了模型的泛化性能。(本文来源于《大连理工大学》期刊2013-04-26)
孟洁[10](2011)在《基于样本约简的支持向量机》一文中研究指出支持向量机是基于统计学习理论发展起来的一种新颖的机器学习方法,它是专门针对小样本数据而言的。支持向量机具有一些不同于其他机器学习方法的独特优点,如间隔最大原则,核函数技术应用,泛化能力强,可调整参数少,能达到全局最优等。正是由于这些优点,支持向量机在很多领域得到了广泛应用。然而,对于大规模数据在训练过程中需要占用很大的存储空间,计算量也非常大,造成了支持向量机的训练速度非常缓慢。在支持向量机训练过程中大量的非支持向量不起作用,只有一小部分支持向量决定着分类边界面,基于这种想法本文提出了一种基于样本约简的支持向量机方法。首先采用支持向量域描述算法构造最小超球,利用内积的一些基本知识去掉球外部分可能的非支持向量样本点,再对球内样本点和球外剩下的样本点利用距离去边缘点,得到最终训练样本集。实验证明了本文方法的有效性,在不损失测试精度情况下大大减少了训练时间,尤其对于样本数目非常大的数据,此方法更为适用。(本文来源于《河北大学》期刊2011-05-01)
样本约简论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
现有的样本约简算法多数是针对某种分类器设计的,在实际应用中有一定的局限性。结合聚类算法的思想,设计了一种适用于不同分类器的样本约简算法,核心是选取密度高且距离相对较远的样本点。与其他样本约简算法相比较,该算法可以根据需求获得任意大小的样本子集,并适用于多种分类算法;而对包含噪声点的样本集,算法的分类精度和稳定性均有一定程度的提高。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
样本约简论文参考文献
[1].杨文君.基于模糊聚类的样本选择约简算法在入侵检测技术中的应用[J].科学技术创新.2017
[2].程汝峰,梁永全,刘彤.一种适用于不同分类器的样本约简算法[J].山东科技大学学报(自然科学版).2017
[3].张国栋,肖娅,周炬,郭薇.一种支持向量机的样本约简方法[J].沈阳航空航天大学学报.2016
[4].杨习贝,颜旭,徐苏平,于化龙.基于样本选择的启发式属性约简方法研究[J].计算机科学.2016
[5].李栋,刘树林,张宏利.基于约简边界样本界面检测器的设备异常度检测方法[J].机械工程学报.2015
[6].梁海龙.基于邻域粗糙集的属性约简和样本约减算法研究及在文本分类中的应用[D].太原理工大学.2015
[7].袁辉,王凤山,许继恒,沈英.基于改进SVM的坑道毁伤仿真训练样本约简模型[J].解放军理工大学学报(自然科学版).2014
[8].杜敏杰,蔡金燕.基于样本约简的实时SVDD算法与电路故障检测应用[J].微电子学与计算机.2013
[9].李奇.基于复杂网络的约简LSSVM样本筛选及其应用[D].大连理工大学.2013
[10].孟洁.基于样本约简的支持向量机[D].河北大学.2011