数据子集论文-周鹏程,何震瀛,荆一楠,王晓阳

数据子集论文-周鹏程,何震瀛,荆一楠,王晓阳

导读:本文包含了数据子集论文开题报告文献综述及选题提纲参考文献,主要关键词:数据分析,差异性数据,过滤模型

数据子集论文文献综述

周鹏程,何震瀛,荆一楠,王晓阳[1](2019)在《查找差异数据子集的过滤规则建模方法》一文中研究指出大数据分析和应用得到了各个行业的关注,人们试图从大量数据中发现蕴含的模式和规律,进而产生更多的价值,数据过滤作为数据分析过程中常用手段所起到的作用是无可替代的。基于方便用户快速筛选数据并找到差异性的数据子集的实际需求~([1]),需要分析与挖掘数据项之间联系,对数据过滤规则进行建模,以帮助用户快速定位到差异性的数据子集。在本篇论文中创新性地提出一种查找差异数据子集的过滤规则建模方法。该方法的目的是解决如何在数据分析中应用数据过滤规则建立分析过滤模型,然后利用模型分析过滤得到差异性的数据子集,最后利用模型完成结果集的自动可视化。利用该建模方法建立的数据分析系统能在真实数据集中快速找到差异性数据子集,并且自动完成对结果子集的可视化展示,展现了建模方法的实用性和高效性。(本文来源于《软件工程》期刊2019年11期)

闫吉顺,方海超,张盼,王鹏,林霞[2](2019)在《基于时序和空间子集的水深数据优化方法研究》一文中研究指出从时间序列和空间分布2种不同角度,确立了水深数据的子集分割思想并展开了子集分割的方法研究,同时研究了基于时间序列的单子集水深数据线性回归优化方法(LO-TS)和基于空间分布的单子集水深数据特征反距离优化方法(IDC-SD),并结合2种方法自身特点对优化结果进行分析。研究发现2种方法均不改变测区的整体水深分布趋势,而基于时间序列的单子集水深数据线性回归优化方法,优化幅度较大,主要影响因子是波浪起伏,更能表现出测量断面特征,缺点是在水深值变化幅度较大区域容易出现优化率较高的情况。基于空间分布的单子集水深数据特征反距离优化方法,优化幅度较为平稳,一般不会出现优化过度的情况,主要影响因子是邻近区域的水深空间分布特征,能够充分表现出子集的水深分布特征,缺点是没有充分考虑波浪干扰影响。(本文来源于《地理空间信息》期刊2019年10期)

王少妮[3](2019)在《数据子集的显着属性挖掘研究》一文中研究指出数据子集的显着属性是一个数据子集明显区别于其他数据子集的属性,是许多决策制定的科学依据,在实际生活中具有十分重要的应用价值。数据子集的显着属性挖掘具有多个研究对象,这能够反映一个群体与其他群体差异显着的属性。这些显着属性可以指导研究人员、管理者制定并优化相关决策。目前提出的各种关于显着属性挖掘的方法主要研究对象只有单个,并未涉及多个研究对象,而且现有方法无法有效挖掘数据子集的显着属性,难以满足现实中分析群体之间属性差异的需求。针对研究中存在的这些问题,本文提出了基于多个研究对象的数据子集的显着属性挖掘问题。将提出的数据子集的显着属性挖掘问题进行了形式化定义,并设计了组显着属性挖掘(Group Outlying Aspects Mining,GOAM)算法。实验结果表明,相比于传统的显着属性挖掘算法,该算法能够识别出数据子集的显着属性,进而有效解决了实际生活中有关多个研究对象的显着属性挖掘问题。为了进一步验证和说明本文提出的GOAM算法的可用性和实用性,本文将GOAM算法应用于两个真实数据集上,进行了十二组关于数据子集的显着属性挖掘实验,并将这些挖掘得到的显着属性结果进行了可视化分析,这些分析结果可以作为从业者优化管理决策和制定战略计划的科学依据。(本文来源于《西安石油大学》期刊2019-06-05)

杜冲,周长银[4](2019)在《基因表达数据特征子集的冗余研究》一文中研究指出过滤式特征选择是一种在基因表达数据上广泛使用且简单有效的方法。针对其特征子集冗余性问题,使用皮尔逊相关系数,提出一种带冗余去除的特征选择算法。研究了在不同相关强度下特征子集冗余去除及分类准确度效果。实验选用叁个不同的基因表达数据集,使用支持向量机、k近邻、随机森林作为分类器分别进行了测试。实验结果表明,带冗余去除的过滤式特征选择方法在不同分类器上均能获得良好的分类性能,另外,此方法在降低特征子集维度的同时能够提高分类准确度。(本文来源于《统计与信息论坛》期刊2019年05期)

孙艳歌,尤磊,卲罕,李艳灵[5](2018)在《基于随机标记子集的多标记数据流分类算法》一文中研究指出提出了基于随机标记子集的多标记数据流分类算法,其基本思想是在多标记分类过程中,将原始较大的标记集随机地划分为多个较小的标记子集,并针对每个标记子集训练一个概率分类器链.在充分利用标记间依赖关系的同时,又有效地降低了概率分类器链的时间复杂度.同时,在算法中嵌入了自适应滑动窗口算法来检测概念漂移.实验结果表明,同其他算法相比,在大多数数据集合上能够更有效地预测实例的类标集合,更适合概念漂移的环境.(本文来源于《信阳师范学院学报(自然科学版)》期刊2018年01期)

张婷[6](2015)在《128位向量ALU数据置换指令子集的RTL设计》一文中研究指出为了追求更高的数据处理能力,处理器操作数的精度在不断提高,而实际上很多运算操作并不需要处理如此高精度的数据,这样的操作方式没有充分发挥数据处理资源的全部潜力,造成资源的浪费,因而提出了基于单指令多数据流(SIMD)的子字并行优化策略。然而SIMD寄存器是以字对齐方式为访问形式的存储单元,实际存储器以字节对齐进行访存,因此在并行操作前后需要一个额外的数据转置单元(Permute)对数据进行转置处理,得到符合SIMD寄存器规格的操作数。为实现单指令多数据流SIMD并行处理机制中的数据转置功能,本文研究了基于Power PC的体系架构与AltiVec机制(Power PC体系架构通用处理器的多媒体指令集的扩展)的向量ALU数据转置单元,通过对Power PC体系架构与该处理器指令集的分析,设计实现了SIMD向量并行数据处理技术中负责数据处理的向量转置(Permute)模块。本设计模块处理128位的操作数,采用两级流水线,设计实现了Power PC_ISA指令集数据转置模块中包括向量打包指令、向量解包指令、向量合并指令、向量复制拼接指令、向量选择指令、向量置换指令、向量移位指令和向量聚集指令共八类53条向量转置指令的操作,该转置模块解决了SIMD向量寄存器与实际数据访存操作之间因数据格式不一致而导致并行操作技术对性能优化程度不高的问题。设计电路使用Verilog硬件描述语言完成电路描述,实现电路功能,最后对完成的设计电路进行功能仿真,保证其功能的正确性。本设计在第二级的流水线中引入了交叉开关矩阵(Crossbar Switch)结构完成了数据处理后的数据选择操作,该交叉开关矩阵模块完成了转置模块所有指令的数据选择操作,无阻塞的内部结构保证数据传输速度,根据分析指令之间的操作相似之处,实现指令间的模块共用,精简了电路结构,消除冗余电路,优化模块面积,提高处理速度。(本文来源于《西安电子科技大学》期刊2015-12-01)

唐松,尼玛扎西,格桑多吉,高定国[7](2015)在《最小子集线路划分法在优化拉萨市公交线路设计和数据存储中的应用研究》一文中研究指出规定了最小子集线路划分法规则,并利用最小子集线路划分法优化拉萨市公交线路的数据库存储,给公交线路的数据查询、数据存储和线路调整带来很大便利,将公交系统管理和优化线路引向全新的方向。(本文来源于《安阳工学院学报》期刊2015年06期)

董良国,黄超,迟本鑫,刘玉柱[8](2015)在《基于地震数据子集的波形反演思路、方法与应用》一文中研究指出地震数据与地下介质物性参数之间的复杂关系,决定了地震全波形反演在理论方法上面临着强烈的非线性难题.地下不同物性参数的不同分量在地震数据上具有不同的表现,勘探的不同阶段对地下介质模型的精度也具有不同的要求,这就决定了在地震全波形反演过程中不必时刻追求地震数据全部信息的匹配,部分信息的匹配就有可能解决现阶段的某些问题,还可以一定程度上规避匹配全部地震信息所遇到的强烈非线性难题.基于这样的考虑,我们提出了利用地震数据子集进行波形反演的思路,给出了统一的反演方法,并通过基于包络数据子集以及反射波数据子集的波形反演的理论模型与实际资料反演试验,证明了所提出的波形反演思路和方法的正确性.(本文来源于《地球物理学报》期刊2015年10期)

侯凤贞,毕露,苏静[9](2015)在《数据结构课程中基于队列的子集划分算法改进》一文中研究指出无冲突子集划分问题是数据结构课程中队列应用的常见案例,但在目前国内的数据结构教材上,该问题的求解算法并非最优。文章提出一种时间复杂度相当的改进算法,并对改进前后算法的效果进行了数值验证。结果表明,改进后的算法以更高概率逼近划分子集问题的最优解。(本文来源于《计算机教育》期刊2015年13期)

董良国,迟本鑫[10](2015)在《基于地震数据子集的波形反演思路、方法与应用》一文中研究指出地震数据与地下介质物性参数之间的复杂关系,决定了地震全波形反演在理论方法上面临着强烈的非线性难题。地下不同物性参数的不同分量在地震数据上具有不同的表现,勘探的不同阶段对地下介质模型的精度也具有不同的要求,这就决定了在地震波形反演过程中不必追求地震数据全部信息的匹配,部分信息的匹配就有可能解决现阶段的某些问题,还可以一定程度上规避匹配全部地震信息所遇到的强烈非线性难题。基于这种考虑,我们提出了利用地震数据子集进行波形反演的思路,给出了统一的反演方法,并通过基于包络数据子集以及反射波数据子集的波形反演的理论模型与实际资料反演试验,证明了所提出的FWI反演思路和方法的正确性。(本文来源于《中国石油学会2015年物探技术研讨会论文集》期刊2015-05-13)

数据子集论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

从时间序列和空间分布2种不同角度,确立了水深数据的子集分割思想并展开了子集分割的方法研究,同时研究了基于时间序列的单子集水深数据线性回归优化方法(LO-TS)和基于空间分布的单子集水深数据特征反距离优化方法(IDC-SD),并结合2种方法自身特点对优化结果进行分析。研究发现2种方法均不改变测区的整体水深分布趋势,而基于时间序列的单子集水深数据线性回归优化方法,优化幅度较大,主要影响因子是波浪起伏,更能表现出测量断面特征,缺点是在水深值变化幅度较大区域容易出现优化率较高的情况。基于空间分布的单子集水深数据特征反距离优化方法,优化幅度较为平稳,一般不会出现优化过度的情况,主要影响因子是邻近区域的水深空间分布特征,能够充分表现出子集的水深分布特征,缺点是没有充分考虑波浪干扰影响。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

数据子集论文参考文献

[1].周鹏程,何震瀛,荆一楠,王晓阳.查找差异数据子集的过滤规则建模方法[J].软件工程.2019

[2].闫吉顺,方海超,张盼,王鹏,林霞.基于时序和空间子集的水深数据优化方法研究[J].地理空间信息.2019

[3].王少妮.数据子集的显着属性挖掘研究[D].西安石油大学.2019

[4].杜冲,周长银.基因表达数据特征子集的冗余研究[J].统计与信息论坛.2019

[5].孙艳歌,尤磊,卲罕,李艳灵.基于随机标记子集的多标记数据流分类算法[J].信阳师范学院学报(自然科学版).2018

[6].张婷.128位向量ALU数据置换指令子集的RTL设计[D].西安电子科技大学.2015

[7].唐松,尼玛扎西,格桑多吉,高定国.最小子集线路划分法在优化拉萨市公交线路设计和数据存储中的应用研究[J].安阳工学院学报.2015

[8].董良国,黄超,迟本鑫,刘玉柱.基于地震数据子集的波形反演思路、方法与应用[J].地球物理学报.2015

[9].侯凤贞,毕露,苏静.数据结构课程中基于队列的子集划分算法改进[J].计算机教育.2015

[10].董良国,迟本鑫.基于地震数据子集的波形反演思路、方法与应用[C].中国石油学会2015年物探技术研讨会论文集.2015

标签:;  ;  ;  

数据子集论文-周鹏程,何震瀛,荆一楠,王晓阳
下载Doc文档

猜你喜欢