导读:本文包含了近邻规则论文开题报告文献综述及选题提纲参考文献,主要关键词:局部保持投影,权重k近邻规则,间歇过程,故障检测
近邻规则论文文献综述
张成,郭青秀,冯立伟,李元[1](2019)在《基于局部保持投影–加权k近邻规则的多模态间歇过程故障检测策略》一文中研究指出针对多模态间歇过程故障检测问题,本文提出一种基于局部保持投影–加权k近邻规则(LPP--Wk NN)的故障检测策略.首先,应用局部保持投影(LPP)方法将原始数据投影到低维主元子空间;接下来,在主元子空间中,应用样本第k近邻的局部近邻集确定每个样本的权重并计算权重统计量Dw;最后,应用核密度估计方法确定Dw控制限并进行故障检测.本文方法应用LPP对过程数据进行维数约减,既能够降低训练过程中离群点对模型的影响,又能够降低在线故障检测的计算复杂度.同时,加权k近邻规则(Wk NN)方法通过引入权重规则能够使得过程故障检测统计量分布具有单模态结构.相比传统的k NN统计量,本文引入的权重统计量具有更高的故障检测性能.通过数值例子和半导体蚀刻过程的仿真实验,并与主元分析(PCA), k NN, Wk NN, LPP--k NN等方法进行比较,实验结果验证了本文方法的有效性.(本文来源于《控制理论与应用》期刊2019年10期)
王昱,朱芝孺[2](2018)在《基于改进K-近邻规则的数据库营销分析》一文中研究指出文章提出一种基于改进K-近邻规则的数据库营销模型。根据数据样本的近邻信息动态确定其最优的近邻个数K,以避免人为设定K这一重要参数可能造成的影响。根据K个近邻距样本的距离,设定不同的投票权重以预测样本属于某一类别的概率。在实际数据集上的实证结果表明,提出的改进K-近邻规则不仅为K值设定提供了一种有效的方法,还能够提高数据库营销的准确性和结果的可解释性,可以有效应用于实际的数据库营销。(本文来源于《统计与决策》期刊2018年19期)
张日[3](2018)在《怼美国怼到WTO 加拿大真心不爽》一文中研究指出1月10日,加拿大在世界贸易组织(WTO)就美国在反倾销和反补贴调查中屡次采用的计算方法和广泛实施的贸易规则等提起磋商请求。当天,美国贸易代表罗伯特·莱特希泽表示,加拿大在WTO提起的磋商请求是对美国贸易体系一次“广泛而并不明智的攻击”。他认为(本文来源于《国际商报》期刊2018-01-17)
陈川[4](2015)在《基于近邻规则的间歇过程故障检测算法研究》一文中研究指出间歇过程作为现代工业中的一种重要生产方式,被广泛应用于高附加值,高精细产品的生产和加工中,其安全可靠运行日益成为人们关注的焦点,随着间歇过程故障检测准确性的不断提高,故障检测的实时性成为目前的研究热点。本文以基于KNN的间歇过程故障检测方法(FD-KNN)为研究课题,以间歇过程故障检测实时性的优化为研究目标,开展了以下研究工作,主要研究内容分为叁部分。针对间歇过程广泛存在的批次数据不等长的问题,研究以DTW(动态时间规整)方法为基础的轨迹同步方法。为改善DTW算法在高维数据处理中的速度,本文提出了采用平行四边形窗对DTW搜索路径进行约束优化策略,大大提高了同步速度,并采用TE过程数据进行相应仿真实验,验证了算法的有效性。在FD-KNN方法的基础上,针对间歇过程数据的非线性特点,研究了基于Kernel-KNN的故障检测方法。通过引入核函数思想对基于传统欧式距离的近邻方法进行改进,使正常类样本与故障类样本的差异更为显着,从而提高了故障检测准确率,在TE过程的仿真实验也验证了该算法的有效性。针对Kernel-KNN方法在面对大样本数据或高维数据时计算量和存储量很大的缺点,研究了间歇过程快速故障检测方法。1)针对单工况间歇过程,首先采用剪辑近邻法去除位于训练样本分类面之间的模糊样本,然后采用压缩近邻法去除位于分类面两端的冗余样本,在保留原样本集大部分特征的基础上大大精简了样本集。在TE过程中的仿真研究结果表明,基于快速近邻法的间歇过程故障检测方法提高了算法的运行效率,同时也保证了故障检测准确率。2)针对多工况间歇过程数据特征多样性,导致FD-KKNN检测时错误率较高的问题,本文在深入研究基于K-Means和Kernel-KNN的间歇过程故障检测方法的基础上,改进了基于密度和距离选取初始聚类中心的K-Means方法,将原样本集准确地进行分类。在TE过程中的仿真实验表明,基于改进K-Means和Kernel-KNN的故障检测方法在保证一定准确率的前提下缩短了故障检测时间,提高了故障检测的实时性。(本文来源于《电子科技大学》期刊2015-05-17)
于力超,金勇进,王俊[5](2015)在《缺失数据插补方法探讨——基于最近邻插补法和关联规则法》一文中研究指出提出基于最近邻插补和关联规则的缺失数据插补方法,将不含缺失数据的变量作为辅助变量,通过定义距离函数寻找与含缺失数据的样本单元距离较近的样本,然后利用挖掘得到的关联规则支持度和提升度乘积的倒数作为权重,对样本单元之间的距离进行加权处理,得到加权距离,再用加权距离最小的样本单元对应的属性值对缺失值进行插补。这种方法可以解决由不同最近距离样本单元得到不同插补值的问题,最后给出了该方法的实施步骤和应用范例。(本文来源于《统计与信息论坛》期刊2015年01期)
王凤梅,胡丽霞[6](2012)在《一种基于近邻规则的缺失数据填补方法》一文中研究指出数据缺失是数据挖掘与分析过程中的常见问题,若直接删除含缺失的事例可能导致不可靠的决策。为此,针对缺失数据的填补问题,提出一种基于近邻规则的缺失数据填补方法。根据关联规则的后件数据项进行分类,计算分类后的规则项与缺失项集间的相似度,用最相似的规则项值填补缺失值。实验结果表明,该方法具有较高的填补正确率。(本文来源于《计算机工程》期刊2012年21期)
赵理,王磊,徐庆征[7](2012)在《人工内分泌机制在最近邻规则约减中的应用》一文中研究指出当训练样本集规模过大时,最近邻分类规则约减过程是一个耗时的过程.目前,常见的约减算法往往存在计算成本过高、约减过程难于并行化等问题.针对该问题,文中将人工内分泌机制引入到最近邻规则的约减过程中,保留不同类规则边界上的边界规则,规则的约减规模通过晶格的粒度来设定.该方法可以在分割–约减–合并框架下获得较高的一致性约减子集,从而使规则的约减过程并行化,缩短约减时间.用11个不同的数据集进行仿真实验的结果显示,该方法简单而有效,较好地解决了大样本集的约减问题.(本文来源于《应用科学学报》期刊2012年04期)
康晓萌[8](2012)在《基于模糊粗糙集的压缩近邻规则比较研究》一文中研究指出近邻规则是模式识别、机器学习、数据挖掘中广泛使用的一种基于样本实例的分类方法,该算法通过从训练集中寻找与待分类样本最近的样本来确定其类别。然而近邻规则的一个最大的缺点是在计算未见样本的所属类别时,需要计算该未见样本与训练集中所有样本的距离,算法的时间复杂度和空间复杂度都很高。另一方面,在判断未见样本的所属类别时,训练集里的所有样本都被看成是同等重要的。那么,如果训练集中的样本存在不一致性,近邻规则的性能会大大降低。针对以上两个问题,降低训练集的规模成为近邻规则的研究热点。模糊粗糙集是将粗糙集和模糊集结合起来处理不精确和不确定信息的数学理论。目前关于模糊粗糙集的研究主要集中在模糊粗糙集的定义及其约简上。从模糊粗糙集的定义中可以得出样本隶属于上近似集合、下近似集合以及边界域集合的程度,而这些隶属度表明了样本的重要程度。本文提出了两种基于模糊粗糙集的模糊压缩近邻规则(CFK-NN1和CF K-NN2)和一种改进模糊近邻规则,并对不同的压缩近邻规则进行了比较研究。这两种压缩规则包含叁个步骤:(1)利用模糊粗糙集技术求得一个模糊属性约简;(2)分别从模糊粗糙集正域(边界域)中选取样本子集;(3)从样本子集中抽取模糊分类规则。在若干数据集上得到的实验结果以及对实验结果的统计分析证实了两种方法是可行的、有效的,并且优于之前学者提出的压缩近邻规则,比如CNN,RNN,ICF等。比较研究得出了以下结论:算法CFK-NN1选择的样本个数比算法CF K-NN2,CNN,RNN和ENN选择的少,比算法ICF和MCS选择的多。算法CF K-NN1的测试精度比算法CF K-NN2的测试精度稍高,但两个算法的测试精度都高于其他算法。(本文来源于《河北大学》期刊2012-05-01)
翟俊海,李胜杰,王熙照[9](2012)在《基于粗糙集技术的压缩近邻规则》一文中研究指出近邻(Nearest Neighbor,NN)算法是一种简单实用的监督分类算法。但NN算法在分类未知类标的样例时,需要存储整个训练集,还要计算该样例到训练集中每一个样例之间的距离,所以NN算法的计算复杂度非常高。为了克服这一缺点,P.Hart提出了压缩近邻(Condensed Nearest Neighbor,CNN)规则算法,即从整个训练集中找原样例集的一致子集(一致子集是能正确分类训练集中其他样例的子集)。其计算复杂度依然比较高,特别是对于大型数据库,寻找其一致子集是非常耗费时间的。针对这一问题,提出了基于粗糙集技术的压缩近邻规则算法。该算法分为3步,首先利用粗糙集方法求属性约简(特征选择),以将冗余的属性去掉。然后选取靠近边界域的样例,以将冗余的样例去掉。最后从选出的样例中计算一致子集。该算法能同时沿垂直方向和水平方法进行数据约简。实验结果显示,所提出的方法是行之有效的。(本文来源于《计算机科学》期刊2012年02期)
赵理,王磊[10](2011)在《利用细胞自动机模型约减最近邻分类规则》一文中研究指出目前常见的最近邻分类规则约减算法,只注重约减后分类器的分类精度和被约减的规则数量,而不注重约减效率和约减后分类器的泛化能力。针对该问题,提出了一种细胞自动机(cellular automata,CA)基础上的最近邻分类规则约减方法。该方法只保留不同类边界上的样本点,约减规则的数量可以由细胞自动机网格的粒度动态调节。其优势在于:在给定的大数据集前提下,可以利用较少的运行时间来约减给定的规则样本;可以利用积累或迭代的方式来分步获得原给定样本集的一致性子集。采用13个不同的数据集进行仿真实验,结果显示该算法简单、有效,较好地解决了大样本集的约减问题。(本文来源于《计算机科学与探索》期刊2011年12期)
近邻规则论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
文章提出一种基于改进K-近邻规则的数据库营销模型。根据数据样本的近邻信息动态确定其最优的近邻个数K,以避免人为设定K这一重要参数可能造成的影响。根据K个近邻距样本的距离,设定不同的投票权重以预测样本属于某一类别的概率。在实际数据集上的实证结果表明,提出的改进K-近邻规则不仅为K值设定提供了一种有效的方法,还能够提高数据库营销的准确性和结果的可解释性,可以有效应用于实际的数据库营销。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
近邻规则论文参考文献
[1].张成,郭青秀,冯立伟,李元.基于局部保持投影–加权k近邻规则的多模态间歇过程故障检测策略[J].控制理论与应用.2019
[2].王昱,朱芝孺.基于改进K-近邻规则的数据库营销分析[J].统计与决策.2018
[3].张日.怼美国怼到WTO加拿大真心不爽[N].国际商报.2018
[4].陈川.基于近邻规则的间歇过程故障检测算法研究[D].电子科技大学.2015
[5].于力超,金勇进,王俊.缺失数据插补方法探讨——基于最近邻插补法和关联规则法[J].统计与信息论坛.2015
[6].王凤梅,胡丽霞.一种基于近邻规则的缺失数据填补方法[J].计算机工程.2012
[7].赵理,王磊,徐庆征.人工内分泌机制在最近邻规则约减中的应用[J].应用科学学报.2012
[8].康晓萌.基于模糊粗糙集的压缩近邻规则比较研究[D].河北大学.2012
[9].翟俊海,李胜杰,王熙照.基于粗糙集技术的压缩近邻规则[J].计算机科学.2012
[10].赵理,王磊.利用细胞自动机模型约减最近邻分类规则[J].计算机科学与探索.2011