基于向量的数据模型论文-杜军,寇佳丽,赵培阳

基于向量的数据模型论文-杜军,寇佳丽,赵培阳

导读:本文包含了基于向量的数据模型论文开题报告文献综述及选题提纲参考文献,主要关键词:海洋产业结构升级,海洋科技创新,海洋经济增长,面板向量自回归(PVAR)模型

基于向量的数据模型论文文献综述

杜军,寇佳丽,赵培阳[1](2019)在《海洋产业结构升级、海洋科技创新与海洋经济增长——基于省际数据面板向量自回归(PVAR)模型的分析》一文中研究指出为促进我国海洋经济实现高质量发展,基于2006—2015年的省际面板数据,运用面板向量自回归(PVAR)模型对海洋产业结构升级、海洋科技创新与海洋经济增长之间的动态关系进行实证分析。研究结果表明:海洋产业结构升级对海洋经济增长具有显着的影响,海洋经济增长对海洋科技创新具有显着的影响;从短期来看海洋经济增长对海洋产业结构升级的正向效应不明显,从长期来看海洋经济增长能够促进海洋产业结构优化;海洋科技创新对海洋经济增长的正效应逐渐减弱,海洋产业结构升级是海洋经济增长的格兰杰原因,海洋经济增长是海洋科技创新的格兰杰原因。(本文来源于《科技管理研究》期刊2019年21期)

姚海云,舒红,汪善华,曾坤[2](2019)在《多定位源数据分析的特征向量空间滤波模型及仿真实验》一文中研究指出目前,在室内定位中,鲜有研究者将多个定位源的空间布局这一重要因素考虑到定位结果的估计中来。室内定位中,众多定位源可以看作多个随机变量的一次实现,每个定位源结果并非严格独立,通常存在一定空间布局,可以模拟为确定性空间结构函数或统计空间自相关模型。定位源空间自相关会导致不同定位源影响系数(回归系数)方差膨胀效应和定位结果偏移效应。方差膨胀将导致参数估值的不确定性被低估,最终导致定位结果存在较大偏差。本文特征向量空间滤波模型(Eigenvector Spatial Filtering Model,ESF)将多定位源空间布局归结为一个代理变量,加入一般多元线性回归模型,构造最终的多定位源融合算法。定位源空间自相关效应通过特征向量空间滤波模型的空间代理变量来表征和分离,从而特征向量空间滤波模型满足独立(定位源结果彼此独立)同分布的一般线性回归模型条件。仿真分析表明运用特征向量空间滤波模型使用户定位结果和回归系数估值的精度均有明显提高。(本文来源于《城市勘测》期刊2019年02期)

梁凤[3](2019)在《北京、辽宁省2011-2016年整合百度搜索及传统监测数据的流感支持向量机回归预测模型构建》一文中研究指出目的:1、探讨支持向量机(SVM)回归模型在整合百度搜索引擎数据和传统流感监测数据中的应用;2、探讨北京、辽宁省流感SVM回归模型应用。研究方法:北京、辽宁省2011年1月-2016年12月每月流感发病率数据来自中国国家公共卫生科学数据中心。以“流感”为初始值在“站长之家”挖掘与“流感”关系最为密切的网络关键词。然后在百度指数上收集挖掘出的网络关键词在北京与辽宁省2011年1月-2016年12月的月搜索量。分析不同滞后期关键词与流感发病率之间的相关性,选择相关性有统计学意义且相关系数大于0.4的百度搜索关键词进入SVM回归模型的构建中。采用穷举法列举SVM回归模型中的叁个参数(C、γ、ε)的可能取值,再采用“留一法”交叉验证的方式来选择较优模型参数值进行模型构建。采用均方根误差(RMSE)和均方根相对误差(RMSPE)两个评价指标对模型的性能进行评价。相关分析采用IBM SPSS 22.0软件,SVM回归模型构建使用R 3.4.2中e1071包进行。结果:北京流感发病率的变化幅度比较大,季节性特别明显,且在流感流行高峰季节的发病率呈现逐年递增。辽宁省在流感高峰期的发病率变化幅度相较于北京小很多。相关分析结果显示北京有26个百度关键词进入模型,辽宁省有17个百度关键词进入模型。基于北京流感数据的SVM回归模型中较优模型参数值分别为C=6,γ=0.005,ε=0.01,基于辽宁省流感数据SVM回归模型中较优参数值为C=3,γ=0.005,ε=0.01。北京基于百度关键词数据的模型RMSE和RMSPE最小,为5.491561和0.605623,这两个指标的值与整合数据来源的指标值相差不大,并且都比基于以往流感发病率数据来源的模型指标值要小,可以认为北京的百度关键词模型和整合数据模型的预测效果要好于只基于以往流感发病率数据的支持向量机回归模型。基于滞后1月流感发病率+百度关键词整合数据来源的辽宁省支持向量机回归模型的RMSPE是最小的,为0.290522。因此辽宁省滞后1月流感发病率+百度关键词整合数据模型的预测效果要优于基于以往流感发病率数据的模型。结论:利用互联网搜索引擎查询数据作为传统流感监测的补充数据源具有一定可行性,SVM回归模型对辽宁省流感疫情的跟踪是有效的。基于辽宁省流感历史发病数据与百度搜索数据的支持向量回归模型比基于北京流感历史发病数据与百度搜索数据的模型更加稳定。(本文来源于《中国医科大学》期刊2019-03-01)

张慧妍,段瑜,王小艺,许继平,郑蕾[4](2019)在《数据驱动的模糊支持向量农业水质评价模型》一文中研究指出[目的]针对在线农业水质综合评价中的监测数据噪声及边界模糊问题,建立具有良好抗扰性和等级划分的综合评价模型。[方法]提出了基于数据确定投影寻踪指标权重及模糊隶属度参数的支持向量评价模型。采用改进遗传算法对投影寻踪函数进行了优化求解,获得相对客观的指标权重向量,而后结合数据优化模糊隶属度参数,构建模糊支持向量综合评价模型,以使得监测噪声对评价模型泛化能力的影响减小。此外,考虑到通用的离散化评价等级分辨率较低,提出了区域划分信度的概念,用以辅助说明样本所属区域划分等级的可信程度,实现对综合评价结果进行细化补充说明的目的。[结果]评价模型与专家意见及传统评价方法的结果吻合程度较高,且在监测数据迭加10%至30%的随机噪声时,模型仍能保持85%以上的一致率,样本的区域划分可信度均大于临界值,抗扰效果优于传统模糊综合评价及灰色聚类法。[结论]本文构建的模型具有较好的可行性与鲁棒性,能为后续噪声存在条件下农业水质在线实时综合评价提供借鉴与参考。(本文来源于《水土保持通报》期刊2019年01期)

孙茂伟,杨慧中[5](2018)在《一种基于支持向量数据描述的聚类多模型软测量建模》一文中研究指出在基于聚类的多模型软测量建模中,如果数据聚类后类别之间界限不明显,常会出现样本类别误划分和类边界处样本估计不准确的问题。对此提出一种基于支持向量数据描述算法的聚类多模型软测量建模方法。该方法首先采用仿射传播聚类算法对数据进行类别划分,利用支持向量数据描述算法划定类边界从而确定样本与各类别的位置关系,根据样本与各类的位置关系信息从高斯过程回归算法建立的子模型、全局模型和局部模型中选择合适的模型对样本进行估计。将工业双酚A生产装置的现场数据建模和仿真,结果表明该方法是有效的。(本文来源于《控制工程》期刊2018年07期)

李俊功,鲁万波[6](2018)在《平滑转换向量乘积误差模型及对中国股市高频交易数据的应用》一文中研究指出基于平滑转换理论本文提出了平滑转换向量乘积误差模型(STVMEM)。给出了模型极大似然估计迭代算法的初值选取方法和参数似然估计相结合的参数估计具体过程。参数估计具有一致性和渐进正态性。模拟结果表明参数估计具有良好的有限样本性质。利用信息分解形式的STVMEM对中国股市成交量、持续期和波动率之间关系进行分析,发现成交量冲击与波动率、波动冲击与持续期之间具有非线性关系。(本文来源于《数理统计与管理》期刊2018年06期)

李瑞光,臧国轻[7](2018)在《基于主成分分析-支持向量机的土石坝渗流监测数据预测模型》一文中研究指出为解决土石坝渗流监测数据的分析问题,采用基于主成分分析的支持向量机法,对某均质坝体内渗流浸润线的监测数据建立了预测模型,并针对坝体内的测压管水位进行了具体计算预测。结果表明,主成分分析法可以有效降维,并较好的综合反映坝体内测压管水位的主要影响因素;预测值与实测值的误差分析结果表明,支持向量机模型在小样本坝体监测数据分析预测方面的精度较高,该模型可为其他类似工程监测数据的分析预测提供新的方法。(本文来源于《计算机时代》期刊2018年06期)

黄乐乐[8](2018)在《基于不平衡数据集的支持向量机模型与算法研究》一文中研究指出支持向量机(Support Vector Machine,SVM)是一种重要机器学习算法,它基于VC维和结构风险最小化等统计学习理论发展而来,具有坚实的理论基础和普遍的实用性。其通常在类别相对平衡的数据中能够呈现良好的分类效果。但实际应用中许多分类问题都呈现出高度不平衡特性,对于不平衡的分类问题,支持向量机往往不具有很好的分类性能。本文基于不平衡分类问题的研究背景,对支持向量机算法的原理及其对不平衡数据分类的缺陷进行分析。对现有针对不平衡分类典型的改进型支持向量机算法进行实验验证,详细分析其优点和缺点,并基于此提出一种改进的算法——概率优化代价敏感支持向量机(PCS-SVM)。论文的主要研究内容有:(1)对支持向量机算法作用于不平衡数据效果不佳的原因进行详细分析,并通过实验对所述原因进行验证;基于目前典型的不平衡数据采样方法和改进的支持向量机算法,通过实验验证其在不平衡数据分类上的有效性;并指出传统改进算法的不足之处。(2)基于现有的代价敏感支持向量机算法,引入样本分布概率密度函数(PDF),有效地调整优化问题中的惩罚参数,提出一种改进的支持向量机算法PCS-SVM。算法使用相似度矩阵和预定义的超参数对超平面附近的样本类别进行估算,进而有效调整分离超平面;结合不同改进算法的优点,提高了算法在不同数据特性上的适应性和鲁棒性。(3)利用16组实际不平衡数据集对PCS-SVM算法进行验证,比较PCS-SVM算法与目前典型SVM改进算法的分类性能,使用不同的评价指标对新算法和传统改进算法的预测效果进行评价;并利用T检验的方法进一步比较PCS-SVM算法与其他SVM改进算法,验证PCS-SVM算法的有效性。(本文来源于《南昌航空大学》期刊2018-06-01)

陈同林[9](2018)在《针对高不确定数据集智能决策的混合支持向量机模型》一文中研究指出现今世界上许多信息系统产生了大量的原始数据,这些原始数据往往是具有高度不平衡、高维度、大规模以及属性值各异等特性的高不确定数据。近些年来,通过可靠的机器学习技术来进行大数据挖掘变得尤为普遍。使用一般的机器学习方法来挖掘此类高不确定数据,很难达到令人满意是效果。因此,为了挖掘出高不确定数据中更多隐藏的、有用的信息,开发出高性能的机器学习方法来处理各种高不确定数据是很有必要的。本文提出了一种混合支持向量机模型来挖掘此类高不确定数据,其结构包括预处理、建立模型和参数优化叁部分。数据预处理包括归一化和数据重采样,旨在根据先验知识使数据平滑。本文在重采样基础上,通过选择重复采样的次数,使得样本更加平滑,进一步提高分类器的性能。建立的算法模型为支持向量机(SupportVectorMachine,SVM)模型,它是一种基于结构风险最小化原则的方法,能够很好地处理高维数据,并且具有良好的泛化能力,但是只适合小样本数据,因此本文提出一种针对SVM的处理大规模数据的方法,以提高混合模型对大规模数据的处理能力。本文采用遗传算法(Genetic Algorithm,GA)、最基本粒子群优化法(Particle Swarm Optimization,PSO)和网格搜索算法(Grid Search,GS)叁种优化方法来优化模型的参数以提升混合模型的性能。全文通过数据预处理、建立模型和参数优化叁个阶段选择不同的方法或算法,形成多种混合支持向量机模型,并在所有的混合模型型中经过一定的策略选出最优混合支持向量机模型,该模型能够很好的处理高不确定数据。最后将其应用于医疗数据库中的ECG数据集,并与其它方法对比,验证其优越性。(本文来源于《云南大学》期刊2018-05-01)

张贝贝[10](2017)在《基于类别失衡数据集的改进支持向量机模型的研究》一文中研究指出计算机技术的快速发展,使得数据量迅速地增长。为了利用这些数据来指导当前的工作及科学研究,基于数据挖掘的应用技术被发掘出来并快速发展。许多实际研究中,数据集是类别失衡的,即基于一个类别的数据量与属于另一类别的数据量差距较大,且小样本量类呈现出的信息通常更具价值,故而类别失衡分类问题一直是我们研究数据挖掘的一个热门。传统的机器学习算法,往往会导致对小样本量类的识别率较低,而致使分类器分类性能大幅度降低。建立于统计学习基础之上的分类方法—支持向量机,具有坚实的理论依据,对于类别非失衡数据集有比其他分类算法更好的分类效果,但对于两类失衡样本分类效果稍有欠缺。本文鉴于类别失衡数据集分类难的情况,结合前人的成果提出了边界修剪支持向量机方法。该方法在尽量不降低分类正确率的同时,提高了对小样本量类样本的识别率;同时也弥补了支持向量机在类别失衡数据集分类中的不足,并从以下方面做出了改进。1.分类边界混迭数据的处理。本文主要是对不同类别的样本的边界进行处理,由于边界数据对支持向量的重要影响,故而其对分类器的构建也比较重要。先前大部分的研究工作主要采用将分类边界混迭数据直接删除或简单地添加到小样本量类中的处理方式,而忽略了边界混迭数据对小样本量类的分类精度的影响。鉴于此,本文对边界混迭数据进行了细致地划分与处理。2.不同类别支持向量数目的修剪。本文根据小样本量类样本量与大样本量类支持向量数目的关系采取相应的处理策略。当小样本量类样本量与大样本量类支持向量数目均衡时,通过引入软间隔来求解最优超平面;当两者相差较大时,又提供了 SMOTE算法或仿主成分分析方法,并根据需要进行择优选取;当小样本量类相对稀少且小样本量类的支持向量与大样本量类的支持向量的数量差距较大时,从小样本量类中抽取样本权重较大者,使其与小样本量类中支持向量数目之和与大样本量类的支持向量数目达到均衡,再进行分类器的构建。(本文来源于《安徽理工大学》期刊2017-06-06)

基于向量的数据模型论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

目前,在室内定位中,鲜有研究者将多个定位源的空间布局这一重要因素考虑到定位结果的估计中来。室内定位中,众多定位源可以看作多个随机变量的一次实现,每个定位源结果并非严格独立,通常存在一定空间布局,可以模拟为确定性空间结构函数或统计空间自相关模型。定位源空间自相关会导致不同定位源影响系数(回归系数)方差膨胀效应和定位结果偏移效应。方差膨胀将导致参数估值的不确定性被低估,最终导致定位结果存在较大偏差。本文特征向量空间滤波模型(Eigenvector Spatial Filtering Model,ESF)将多定位源空间布局归结为一个代理变量,加入一般多元线性回归模型,构造最终的多定位源融合算法。定位源空间自相关效应通过特征向量空间滤波模型的空间代理变量来表征和分离,从而特征向量空间滤波模型满足独立(定位源结果彼此独立)同分布的一般线性回归模型条件。仿真分析表明运用特征向量空间滤波模型使用户定位结果和回归系数估值的精度均有明显提高。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

基于向量的数据模型论文参考文献

[1].杜军,寇佳丽,赵培阳.海洋产业结构升级、海洋科技创新与海洋经济增长——基于省际数据面板向量自回归(PVAR)模型的分析[J].科技管理研究.2019

[2].姚海云,舒红,汪善华,曾坤.多定位源数据分析的特征向量空间滤波模型及仿真实验[J].城市勘测.2019

[3].梁凤.北京、辽宁省2011-2016年整合百度搜索及传统监测数据的流感支持向量机回归预测模型构建[D].中国医科大学.2019

[4].张慧妍,段瑜,王小艺,许继平,郑蕾.数据驱动的模糊支持向量农业水质评价模型[J].水土保持通报.2019

[5].孙茂伟,杨慧中.一种基于支持向量数据描述的聚类多模型软测量建模[J].控制工程.2018

[6].李俊功,鲁万波.平滑转换向量乘积误差模型及对中国股市高频交易数据的应用[J].数理统计与管理.2018

[7].李瑞光,臧国轻.基于主成分分析-支持向量机的土石坝渗流监测数据预测模型[J].计算机时代.2018

[8].黄乐乐.基于不平衡数据集的支持向量机模型与算法研究[D].南昌航空大学.2018

[9].陈同林.针对高不确定数据集智能决策的混合支持向量机模型[D].云南大学.2018

[10].张贝贝.基于类别失衡数据集的改进支持向量机模型的研究[D].安徽理工大学.2017

标签:;  ;  ;  ;  

基于向量的数据模型论文-杜军,寇佳丽,赵培阳
下载Doc文档

猜你喜欢