导读:本文包含了大规模样本集论文开题报告文献综述及选题提纲参考文献,主要关键词:支持向量机,大规模样本,超椭球面,快速训练算法
大规模样本集论文文献综述
李飞,李红莲[1](2012)在《支持向量机大规模样本快速训练算法》一文中研究指出普通的支持向量机算法在对大规模样本进行分类的时候有着较高的时间代价。随着训练样本数量的增多,支持向量机的训练速度问题将会越发明显,并且成为制约其实际应用的瓶颈。针对此问题提出了超椭球面方法,通过去掉噪声点、冗余点,并保留能明确体现样本在空间分布位置特征的样本点,以达到提高支持向量机对大规模样本训练速度的目的。实验表明,超椭球面法在最大限度保证识别正确率的前提下可以大幅加快支持向量机的训练速度。(本文来源于《北京信息科技大学学报(自然科学版)》期刊2012年02期)
陈圣兵,李龙澍[2](2011)在《基于近邻距离的大规模样本集去噪与减样》一文中研究指出在分析传统样本缩减方法局限性的基础上,提出一种距离模型及样本的类内距离和类间距离的度量方法。给出利用该距离模型进行噪声识别和样本重要性评价方法及训练样本的缩减算法。该算法剔除噪声样本,根据样本相似性、类间距离和周围被剔除样本的数目,直接从原始样本空间剔除次要样本。仿真结果表明,该距离模型偶然性小,抗噪能力强,缩减效果优于传统的样本缩减方法。(本文来源于《计算机工程》期刊2011年05期)
李元诚,刘克文[3](2010)在《面向大规模样本的核心向量回归电力负荷快速预测方法》一文中研究指出将适用于解决大规模样本训练问题的核心向量回归(corevector regression,CVR)方法引入到电力负荷预测中,并采用粒子群优化(particle swarm optimization,PSO)方法对CVR的模型参数进行寻优,从而提出了一种基于PSO-CVR的负荷预测新模型。构造大规模负荷训练样本,研究对样本负荷产生影响的因素,从而确定样本集的构造。通过用PSO对CVR的模型参数进行优化,得到优化后的CVR预测模型,循环构造预测样本并进行连续预测。算例分析结果表明,在相同时耗下,所提出的优化CVR预测模型能够通过训练更大规模的样本得到比支持向量回归(support vector regression,SVR)方法更高的预测精度。(本文来源于《中国电机工程学报》期刊2010年28期)
朱方,顾军华,杨欣伟,杨瑞霞[4](2009)在《一种新的支持向量机大规模训练样本集缩减策略》一文中研究指出支持向量机(SVM)在许多实际应用中由于训练样本集规模较大且具有类内混杂孤立点数据,引发了学习速度慢、存储需求量大、泛化能力降低等问题,成为直接使用该技术的瓶颈。针对这些问题,通过在点集理论的基础上分析训练样本集的结构,提出了一种新的支持向量机大规模训练样本集缩减策略。该策略运用模糊聚类方法快速的提取出潜在支持向量并去除类内非边界孤立点,在减小训练样本集规模的同时,能够有效地避免孤立点数据所造成的过学习现象,提高了SVM的泛化性能,在保证不降低分类精度的前提下提高训练速度。(本文来源于《计算机应用》期刊2009年10期)
骆世广,骆昌日,周业明[5](2008)在《针对大规模样本集的SMO训练策略》一文中研究指出SMO算法是目前解决支持向量机训练问题的一种十分有效的方法,但是当面对大样本数据时,SMO训练速度十分缓慢。首先,分析了SMO迭代过程中目标函数值的变化情况,进而提出以目标函数值的改变量作为算法终止的判定条件和在SMO迭代后期改变SMO的循环条件两种策略。在几个着名的数据集的试验结果表明,该方法可以大大缩短SMO的训练时间,特别适用于大样本数据。(本文来源于《广东技术师范学院学报》期刊2008年09期)
王萍,王汉芝,岳斌,林孔元,刘还珠[6](2003)在《一种大规模样本数据的特征提取方法》一文中研究指出针对沙尘暴样本数据的特点 ,根据专家经验依次通过聚类分析、建立典型模式类、计算中心场 ,再以样本与中心场的距离作为样本的特征 ,成功地在每个样本的几百个数据中提取到 40个特征。通过对提取特征的统计检验 ,说明了本文所用方法的有效性 ;同时 ,提出了一种建立在K L变换基础上的特征综合方法 ,协助完成关于多维特征的类间差异检验(本文来源于《天津轻工业学院学报》期刊2003年04期)
大规模样本集论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在分析传统样本缩减方法局限性的基础上,提出一种距离模型及样本的类内距离和类间距离的度量方法。给出利用该距离模型进行噪声识别和样本重要性评价方法及训练样本的缩减算法。该算法剔除噪声样本,根据样本相似性、类间距离和周围被剔除样本的数目,直接从原始样本空间剔除次要样本。仿真结果表明,该距离模型偶然性小,抗噪能力强,缩减效果优于传统的样本缩减方法。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
大规模样本集论文参考文献
[1].李飞,李红莲.支持向量机大规模样本快速训练算法[J].北京信息科技大学学报(自然科学版).2012
[2].陈圣兵,李龙澍.基于近邻距离的大规模样本集去噪与减样[J].计算机工程.2011
[3].李元诚,刘克文.面向大规模样本的核心向量回归电力负荷快速预测方法[J].中国电机工程学报.2010
[4].朱方,顾军华,杨欣伟,杨瑞霞.一种新的支持向量机大规模训练样本集缩减策略[J].计算机应用.2009
[5].骆世广,骆昌日,周业明.针对大规模样本集的SMO训练策略[J].广东技术师范学院学报.2008
[6].王萍,王汉芝,岳斌,林孔元,刘还珠.一种大规模样本数据的特征提取方法[J].天津轻工业学院学报.2003