导读:本文包含了数据分类处理论文开题报告文献综述及选题提纲参考文献,主要关键词:云计算背景,大数据,自动分类处理,SOA
数据分类处理论文文献综述
郇林[1](2019)在《云计算背景下大数据自动分类处理系统设计研究》一文中研究指出网络大数据平台能够有效分类数据,也是实现全新应用及网民查询体验得到提高的主要途径。以此,就设计资源占用率较低,并且稳定新较高的网络大数据平台自动分类处理系统,网民能够直接使用系统显示端,主要目的就是获得网络大数据,显示大数据获得的结构及特征分类结果。服务器端使用SOA体系结构,能够提供网络大数据平台的数据分类服务,在网络大数据中融入特征数据分类标准,并且传递到逻辑层处理端。最后,对设计系统进行实验,实验结果表示系统具有良好的稳定性,资源占用率比较低。(本文来源于《电子设计工程》期刊2019年23期)
杨娜,黄玮,单兰兰,段敬怡,于红鑫[2](2019)在《UPLC-Q-TOF/MS结合数据后处理快速分类及鉴定丹参成分》一文中研究指出目的借助超高效液相色谱-四级杆飞行时间质谱(UPLC-Q-TOF/MS)结合数据后处理技术(特征性碎片和中性丢失)实现丹参中化学成分的快速分类及鉴定。方法使用UPLC-Q-TOF/MS仪器对样品进行分析,采用Waters ACQUITY UPLC BEH C_(18) Column色谱柱(100 mm×2.1 mm, 1.7μm),以0.05%甲酸水(A)和0.05%甲酸乙腈溶液(B)进行梯度洗脱。在正负离子模式下得到碎片信息,将获取的质谱图中碎片离子信息与之前查阅文献总结的不同类别化合物裂解产生的特征性碎片和中性丢失分子结合来进行目标化合物的快速鉴定和分类。结果最终鉴定出25个化学成分,其中包括萜类、酚酸类等。结论建立的方法实现了对丹参复杂化学成分的快速鉴定和分类,进一步的推进了中药化学成分研究方法的发展。(本文来源于《时珍国医国药》期刊2019年10期)
李晓霞,程伟丽,张雷,张朝阳[3](2019)在《大数据处理中分类算法的数值比较》一文中研究指出针对大数据背景下机器学习的3种新分类算法:支持向量机、增强决策树、随机森林和传统分类的3种算法:逻辑回归、K最近邻法和线性判别分析法,选取了七个不同行业的实例数据集用上述六种分类算法进行数值分析,计算六种分类算法在测试集的总误判概率和两种错误的误判率.分析结果表明:从预测角度上大数据情况下新的机器学习分类算法尤其是随机森林和增强决策树的表现明显优于传统的分类算法.(本文来源于《数学的实践与认识》期刊2019年13期)
柳惠秋[4](2019)在《船舶物联网远程监控数据分类处理》一文中研究指出传统方法在处理船舶远程监控数据分类问题时会倾向于单一处理,导致分类结果过于分散,且处理速度过慢,不利于对船舶远程监控数据的整体分析,为此提出并设计了船舶物联网远程监控数据分类处理方法。利用动态数据的映射反应对多维空间内的远程监控数据进行标记,并确定分类处理的数据范围,引用BP神经网络算法,对远程监控数据进行分类计算,将监控数据执行分类处理逻辑,实现远程监控数据的分类过程。仿真实验结果表明,设计的数据分类方法能够实现远程监控数据的有序、紧密分类,且数据处理速度比传统方法的处理速度高出23.1%,具备极高的有效性。(本文来源于《舰船科学技术》期刊2019年06期)
马海荣,程新文[5](2018)在《一种处理非平衡数据集的优化随机森林分类方法》一文中研究指出利用传统随机森林(random forest,RF)模型进行分类时存在分类精度受不平衡样本集的影响,以及投票平局现象会导致算法停滞等问题.本文对RF模型进行了优化改进,首先随机抽取等量的少数类与多数类样本构建训练样本集进行RF建模,然后根据投票熵与基于样本特征参数的广义欧几里得距离逐步添加具有最大投票熵的样本到训练样本集,解决传统RF模型随机抽取样本时训练样本集中包含不同类别样本数不平衡问题.对于分类过程中可能出现投票结果的平局现象,利用测试样本与邻近训练样本的广义欧几里得距离决定其分类结果,以消除投票平局现象造成的停滞问题.实验结果表明,本文优化RF模型对于非平衡数据集的分类可以取得较好的分类结果.(本文来源于《微电子学与计算机》期刊2018年11期)
刘力铭,杨得新,孟昉,陈俊涛[6](2018)在《船舶大数据库可视化处理下不均衡数据碎片分类识别》一文中研究指出传统船舶数据碎片识别技术不能良好追踪逆向工程中数据的恢复情况。为解决上述问题,提出船舶大数据库可视化处理下的新型不均衡数据碎片分类识别方法。通过大数据库信息的获取、数据可视栅格化处理2个步骤,完成基于大数据库的船舶信息可视化处理。在此基础上,通过数据碎片的特征描述、识别优劣度量确定、分类识别流程完善3个步骤,完成新型方法的顺利搭建。对比实验结果表明,应用船舶大数据库可视化处理下的不均衡数据碎片分类识别方法后,逆向工程中恢复数据的追踪水平得到有效促进。(本文来源于《舰船科学技术》期刊2018年20期)
张素智,杨芮,赵亚楠[7](2018)在《食品安全大数据的融合及分类并行处理技术研究》一文中研究指出食品安全大数据具有多源、高层次、强关联等特征,通过对食品安全大数据挖掘处理可快速高效地发掘数据的潜在价值,帮助提高食品安全态势感知及预测、病因性食品关联等综合分析能力.对食品安全大数据的融合及分类并行处理技术进行综述.介绍了食品安全大数据的来源、类型和特征并总结其关键处理技术;阐述了食品安全大数据预处理方法即数据融合技术;归纳了食品安全大数据挖掘技术,包括并行处理的叁种计算模型以及多种聚类方法,如减法聚类、K-Means经典聚类、核聚类及谱聚类等;最后,对食品安全大数据未来的挑战和研究方向进行总结和展望.(本文来源于《湖北民族学院学报(自然科学版)》期刊2018年03期)
曹瑜,王楠,徐志超[8](2019)在《Spark框架结合分布式KNN分类器的网络大数据分类处理方法》一文中研究指出针对现有大数据分类方法难以满足大数据应用中时间和储存空间的限制,提出了一种基于Apache Spark框架的大数据并行多标签K最近邻分类器设计方法。为了通过使用其他内存操作来减轻现有MapReduce方案的成本消耗,首先,结合Apache Spark框架的并行机制将训练集划分成若干分区;然后在map阶段找到待预测样本每个分区的K近邻,进一步在reduce阶段根据map阶段的结果确定最终的K近邻;最后并行地对近邻的标签集合进行聚合,通过最大化后验概率输出待预测样本的目标标签集合。在PokerHand等四个大数据分类数据集上进行实验,该方法取得了较低的汉明损失,证明了其有效性。(本文来源于《计算机应用研究》期刊2019年11期)
张雨晴[9](2018)在《一种新的不平衡数据处理方法在股票分类中的应用》一文中研究指出随着我国金融市场的不断发展,越来越多的投资者将目光投向了股票市场。如何科学合理地进行股票的分析,选择优质股票是每一个投资者所要解决的首要问题。从基本面而言,公司的财务数据对股票的选择尤为重要。但在选股时,优质股票的数目远远小于普通股票即数据集是不平衡的,并且公司的财务数据往往是高维的,含有一些不相关特征,因此对数据进行平衡化处理以及进行特征选择是很有必要的。本文对原有的过抽样方法borderline-SMOTE算法与AD AS YN算法加以创新,提出一种混合式的BASMOTE算法,在borderline-SMOTE基础上引入ADASYN算法自适应的思想,根据周围样本的分布自适应的合成新的少数类样本,在容易分类的地方合成较少的样本,在较难分类的地方合成较多的样本。从而获得更加有效合理的新的少数类样本。其次提出一种混合式的特征选择方法HPMG,对叁种过滤式特征选择方法中引入封装式特征选择的思想,使用分类器的训练准确率作为每种过滤式特征选择方法确定特征个数的依据,并使用集成算法中的简单投票算法确定最终结果。本文利用上市A股中某一行业的股票财务数据,使用SVM作为分类器,分别把BASMOTE算法、混合式特征选择方法HPMG,与几种原有的过抽样方法以及特征选择方法作对比。验证了 BASMOTE算法与混合式特征选择方法HPMG优于已有的过抽样方法以及特征选择方法。(本文来源于《北京交通大学》期刊2018-06-01)
于国超[10](2018)在《建筑物表面叁维激光点云数据分类处理方法研究》一文中研究指出地面叁维激光扫描是一种快速获取高精度空间信息的新技术,相比传统的测量方式具有快速性、主动性、非接触测量、数字化、自动化、数据采样率高等优势。激光点云数据在空间上分布离散、不规则,对点云数据的处理与分类较传统测量数据复杂,如何从数以千万计的点云数据中提取出扫描建筑物的特征信息是叁维模型重建的关键问题。针对点云数据的特征提取,本文开展了地面激光点云数据的处理与分类研究,并提取分类处理后点云数据的特征线以达到构建建筑物叁维模型的目的。本文以建筑物点云数据为研究对象,根据点云数据的RGB值和回波强度进行分类处理并进行特征提取,为构建叁维建筑模型提供依据。通过对点云数据的RGB值和回波强度的统计分析,探讨不同类别点云的RGB值分布规律和回波强度修正模型;依据分类标准构建点云分类模型,对点云数据进行分类处理,并提取出建筑物的特征线;基于特征线完成叁维模型重建。研究内容包括:(1)通过对不同类别扫描对象的RGB值统计分析,确定不同类别扫描对象的RGB值区间,能够提取一定比例的点云,在点云数据分类提取中具有适用性;(2)通过相关分析可以确定影响点云回波强度的因素包括:扫描距离、扫描角度和扫描对象,并总结出回波强度修正模型,将点云回波强度修正到相同扫描距离和扫描角度条件下的强度值,利用强度值的分类可以进一步提高分类提取准确度,并有效提取不同反射特征的扫描对象;(3)利用分类后点云数据提取扫描对象的特征信息,并实现扫描建筑的叁维模型重建。本文提供了一种点云数据处理和分类的方法,通过分类模型提取相应比例的不同类别点云,依据分类点云提取扫描对象的特征信息实现扫描对象叁维模型的重建,对地面激光点云数据的处理和应用具有一定的理论意义和应用价值。(本文来源于《河北师范大学》期刊2018-05-23)
数据分类处理论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
目的借助超高效液相色谱-四级杆飞行时间质谱(UPLC-Q-TOF/MS)结合数据后处理技术(特征性碎片和中性丢失)实现丹参中化学成分的快速分类及鉴定。方法使用UPLC-Q-TOF/MS仪器对样品进行分析,采用Waters ACQUITY UPLC BEH C_(18) Column色谱柱(100 mm×2.1 mm, 1.7μm),以0.05%甲酸水(A)和0.05%甲酸乙腈溶液(B)进行梯度洗脱。在正负离子模式下得到碎片信息,将获取的质谱图中碎片离子信息与之前查阅文献总结的不同类别化合物裂解产生的特征性碎片和中性丢失分子结合来进行目标化合物的快速鉴定和分类。结果最终鉴定出25个化学成分,其中包括萜类、酚酸类等。结论建立的方法实现了对丹参复杂化学成分的快速鉴定和分类,进一步的推进了中药化学成分研究方法的发展。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
数据分类处理论文参考文献
[1].郇林.云计算背景下大数据自动分类处理系统设计研究[J].电子设计工程.2019
[2].杨娜,黄玮,单兰兰,段敬怡,于红鑫.UPLC-Q-TOF/MS结合数据后处理快速分类及鉴定丹参成分[J].时珍国医国药.2019
[3].李晓霞,程伟丽,张雷,张朝阳.大数据处理中分类算法的数值比较[J].数学的实践与认识.2019
[4].柳惠秋.船舶物联网远程监控数据分类处理[J].舰船科学技术.2019
[5].马海荣,程新文.一种处理非平衡数据集的优化随机森林分类方法[J].微电子学与计算机.2018
[6].刘力铭,杨得新,孟昉,陈俊涛.船舶大数据库可视化处理下不均衡数据碎片分类识别[J].舰船科学技术.2018
[7].张素智,杨芮,赵亚楠.食品安全大数据的融合及分类并行处理技术研究[J].湖北民族学院学报(自然科学版).2018
[8].曹瑜,王楠,徐志超.Spark框架结合分布式KNN分类器的网络大数据分类处理方法[J].计算机应用研究.2019
[9].张雨晴.一种新的不平衡数据处理方法在股票分类中的应用[D].北京交通大学.2018
[10].于国超.建筑物表面叁维激光点云数据分类处理方法研究[D].河北师范大学.2018