导读:本文包含了聚类裁剪论文开题报告文献综述及选题提纲参考文献,主要关键词:聚类,密度,样本裁剪,KNN
聚类裁剪论文文献综述
王艳飞[1](2018)在《基于聚类和密度裁剪的改进KNN算法》一文中研究指出形形色色的信息汇聚成浩瀚的数据海洋,如何快速对数据进行准确的分类并从中提取出有用的信息已经成为人们面临的一大现实问题,因此,如何解决这一难题的工作已经逐渐变成了一类热门的研究课题,即数据挖掘。数据分类作为数据挖掘的重要一环,其主要目标是通过采用一些高效的分类算法,来尽可能准确地预测待测样本的类别,其中KNN算法作为一种比较经典的分类算法,准确率高,简单有效。但是经典KNN算法在处理样本数繁多的样本集时需要巨大的计算量,从而使得数据分类过程消耗过多的时间。本文提出了一种改进KNN算法,该算法在训练阶段首先根据样本密度对整个训练集进行裁剪,然后将裁剪好的训练集进行聚类处理,得到了若干个密度比较均匀的类簇,接下来以类簇的形心向量为球心,类簇中心到与之距离最远的样本点之间的距离为半径,将类簇转化为超球,并根据超球所包含的样本数在其所属类别的总样本数中所占的比例为其赋予权值。在测试阶段,采用了基于k个超球和基于1个超球的两种侧重点不同的测试方法,其中,基于k个超球的方法更侧重于使算法取得更高的准确率,而基于1个超球则更侧重于使算法耗费更少的分类时间。由于在训练阶段有效地降低了训练样本数并且改善了样本的分布情况,因此测试阶段的计算量会大大下降而且准确率也得到了一定程度的改善。最后在选取的10个UCI样本集上对本文算法进行模拟实验,实验结果表明,本文提出的算法是一种有效的分类方法,它在分类准确率和分类时间这两个方面均取得了良好的实验结果。(本文来源于《青岛大学》期刊2018-05-14)
谢攀,邓珍荣,朱益立[2](2018)在《结合文本信息量和聚类的文本裁剪算法》一文中研究指出针对KNN文本分类时间效率低的缺点,提出一种结合文本信息量和聚类的文本裁剪算法。考虑到训练文本中存在类别相关性弱的文本,计算每条文本包含的信息量并排序,对向量空间模型利用聚类删除噪声文本,结合文本的重要性在各类别中筛选出代表文本构建新的样本空间,在新样本空间上进行分类。实验结果表明,该方法能合理有效地裁剪文本集,提高分类效率。(本文来源于《计算机工程与设计》期刊2018年03期)
张强,吴腾飞,杨颖[3](2010)在《基于候选对象裁剪的密度子空间聚类》一文中研究指出针对目前子空间聚类算法存在精度差、效率低的问题,设计了一种子空间聚类算法DSUB.提出了裁剪候选对象的方法,减少了候选聚类对象的个数且对候选对象分组,使得待搜索的聚类簇只能是某个组的子集,可降低后续聚类处理的复杂度.此外,提出了新的邻域查询方法和抽样覆盖策略用以提高密度聚类的处理速度.实验结果表明:DSUB算法精度高,能够发现任意形状的聚类簇;计算复杂度与数据量呈线性关系;抗噪声性能强;聚类结果与处理顺序无关.DSUB算法非常适合处理子空间聚类.(本文来源于《天津大学学报》期刊2010年07期)
马洪伟,赵志刚,吕慧显,李京[4](2008)在《基于蚁群聚类和裁剪方法的RBF神经网络优化算法》一文中研究指出提出了一种基于蚁群聚类算法和裁剪方法的RBF神经网络优化算法。利用蚁群算法的并行寻优特征和一种自适应调整挥发系数的方法,提出一种新的聚类算法来确定RBF神经网络中基函数的位置;通过一种裁减的方法,除去对整个网络的输出贡献不是很重要的隐层单元来约简隐含层的神经元,以达到简化RBF神经网络结构的目的。对非线性函数进行逼近仿真,结果表明:优化算法有比较好的优化效果,而且,优化后的RBF神经网络的结构小,RBFNN的泛化能力得到了提高。(本文来源于《青岛大学学报(工程技术版)》期刊2008年03期)
张巍,吴晓如,刘江,王仁华[5](2007)在《语音库裁剪的一种不定长递阶聚类方法》一文中研究指出大量使用不定长是大语料库语音合成质量的一个重要保证,而语音库裁剪方法通常会导致不定长的损失.针对这一关键性问题,该文构建了NuClustering-VPA算法:对不同粒度的不定长变体进行聚类,根据高阶聚类结果调整低阶变体的聚类,使得低阶聚类中心有所偏向.NuClustering-VPA算法保留了最重要的不定长,从而有效减小了裁剪对不定长的破坏.测听实验表明,利用NuClustering-VPA算法,即使在语音库裁减率为39.63%时,合成自然度下降较小,仍然保持在较高的水平.这一技术已被应用在科大讯飞公司的实际语音产品中.(本文来源于《计算机学报》期刊2007年11期)
刘宏芳,阳东升,刘忠,张维明[6](2006)在《战场资源的裁剪与聚类方法研究》一文中研究指出战场资源的裁剪是从战场态势的全局资源视图产生基于任务的战术视图。通过对功能能力、作战平台资源和作战任务的定义,提出了基于任务的作战资源实体剪裁方法,包括作战使命的分解、资源实体裁剪过程的数学描述以及作战资源实体分配到任务的匹配算法,并以联合战役为例,分析并设计了从联合战役作战资源的全局视图生成基于任务的战术资源视图。(本文来源于《系统仿真学报》期刊2006年09期)
聚类裁剪论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对KNN文本分类时间效率低的缺点,提出一种结合文本信息量和聚类的文本裁剪算法。考虑到训练文本中存在类别相关性弱的文本,计算每条文本包含的信息量并排序,对向量空间模型利用聚类删除噪声文本,结合文本的重要性在各类别中筛选出代表文本构建新的样本空间,在新样本空间上进行分类。实验结果表明,该方法能合理有效地裁剪文本集,提高分类效率。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
聚类裁剪论文参考文献
[1].王艳飞.基于聚类和密度裁剪的改进KNN算法[D].青岛大学.2018
[2].谢攀,邓珍荣,朱益立.结合文本信息量和聚类的文本裁剪算法[J].计算机工程与设计.2018
[3].张强,吴腾飞,杨颖.基于候选对象裁剪的密度子空间聚类[J].天津大学学报.2010
[4].马洪伟,赵志刚,吕慧显,李京.基于蚁群聚类和裁剪方法的RBF神经网络优化算法[J].青岛大学学报(工程技术版).2008
[5].张巍,吴晓如,刘江,王仁华.语音库裁剪的一种不定长递阶聚类方法[J].计算机学报.2007
[6].刘宏芳,阳东升,刘忠,张维明.战场资源的裁剪与聚类方法研究[J].系统仿真学报.2006