大规模分类论文-任佳丽,王文晶

大规模分类论文-任佳丽,王文晶

导读:本文包含了大规模分类论文开题报告文献综述及选题提纲参考文献,主要关键词:深度学习,数据分类,不平衡数据集,卷积神经网络

大规模分类论文文献综述

任佳丽,王文晶[1](2019)在《基于差分孪生卷积神经网络的大规模不平衡数据分类算法》一文中研究指出传统基于支持向量机的不平衡数据分类算法包含矩阵运算,无法应用于大规模的不平衡数据集。针对这种情况,提出基于差分孪生卷积神经网络的大规模不平衡数据分类算法。设计差分卷积机制增强卷积神经网络的深度结构表示能力,在不改变滤波器数量的情况下提高模型的判别能力。通过差分孪生卷积神经网络分别优化每个类的特征图,每个类关联多个超平面,根据输入样本与超平面的距离决定输出样本的类标签。基于多组不平衡数据集的实验结果表明,该算法实现了较好的分类性能。(本文来源于《计算机应用与软件》期刊2019年11期)

曹海燕,马子昌,杨晓慧,胡文娟,许方敏[2](2019)在《大规模MIMO系统中基于用户位置和用户分类的导频分配》一文中研究指出针对大规模MIMO通信系统中存在的导频污染问题,提出了一种基于用户位置和用户分类的导频分配方案。该方案根据路径损耗和到达角设计目标函数及合理阈值,通过将用户的目标函数与阈值进行比较,把系统中所有用户分为高干扰和低干扰两类,接着为低干扰用户复用导频序列、高干扰用户分配额外正交导频序列来减轻导频污染。仿真结果表明,该方案提高了通信系统性能。(本文来源于《电信科学》期刊2019年10期)

何昕[3](2019)在《分清轻重缓急 提高急救效率——大规模伤亡中的检伤分类》一文中研究指出二战题材经典军事影片《拯救大兵瑞恩》的开头段落,再现了1944年6月6日盟军在诺曼底地区"奥马哈"海滩("奥马哈"为美军为登陆场起的代号,并非地名)迎着防守德军火力进行登陆作战的场景。其中是有一段情景,医务兵韦德冒着横飞的枪弹匍匐在滩头,跟随着同样匍匐前进的军医经过一排伤(本文来源于《轻兵器》期刊2019年07期)

文灿,毛洋青[4](2019)在《深圳:以绿色发展理念推进垃圾分类》一文中研究指出近日,从市城管和综合执法局获悉,目前深圳已建立了覆盖全市的垃圾分流分类收运处理系统,逐步培育了分流分类体系的产业链,分流分类回收量约2700吨/日,减量效果显着。此外,全市805个住宅小区已实现“集中分类投放+定时定点督导”的住宅区垃圾分类模式,下半(本文来源于《深圳商报》期刊2019-06-17)

彭金冀[5](2019)在《大规模短文本分类系统的设计与实现》一文中研究指出互联网的普及使得顾客对客户服务的需求可以借助在线客服快速得到满足,但随着企业产品线的增加和互联网用户的增长,传统的客服系统已经无法轻易满足现代企业和用户的需要。而借助迅速发展的人工智能(Artificial Intelligence,AI)技术助力的智能客服系统可以很好的帮助解决该难题。智能客服系统中,有一大类是基于FAQ(Frequently Asked Questions)进行的,精确地将用户问题和FAQ中标准问题进行匹配是该类智能客服系统的主要任务,该任务可以通过使用文本分类技术来完成。然而,现代企业提供的FAQ数量越来越多,动辄多达上万个,而用户问题又大多都是短文本,包含信息更少的同时还常常带有噪声且缺少主题性,这都大大增加了分类的难度。因此解决这一问题需要面临大规模和短文本两个方面的挑战。目前对于短文本分类有基于传统方法和基于深度学习方法的解决方案,传统方法通常需要依赖相关性高的外部数据,深度学习方法近几年表现更突出,但还未有在FAQ匹配语料上进行分类任务的相关研究。对于大规模文本分类,通常考虑采用层次分类,但目前的层次分类结构大多基于类别间既有的关系来构建,没有充分利用类别间的表示信息。针对智能客服系统中大规模类别的短文本分类需求,本文设计并实现了一个大规模短文本分类系统,通过给管理员和用户两类人群提供对应服务,实现该需求。该系统通过给智能客服场景下的短文本设计一种好的表示方法来改善短文本的数据稀疏问题,在基于传统方法或深度学习方法的多种文本表示方法上进行优化,最终选择了基于卷积神经网络的短文本表示方案。然后利用短文本表示得到类别表示,进而基于类间可分性构造层次分类结构来缓解大规模类别数的问题,在系统设计阶段,本文提出了 5种方案的层次分类结构,并通过对比实验,最终从5个实验方案的结构中选出了在语料平衡和语料不平衡的情况下效果最优的两种层次分类结构,在提高针对大规模短文本分类性能的同时,提供给系统自动根据语料平衡情况选择实验方案中效果最优结构的功能。在该系统上的测试结果表明,本论文提出的系统方案可以提供比传统方案性能更好的智能客服服务。(本文来源于《北京邮电大学》期刊2019-06-04)

叶健,赵慧[6](2019)在《基于大规模弹幕数据监听和情感分类的舆情分析模型》一文中研究指出随着在线视频平台的快速发展,弹幕逐渐成为人们表达观点的一个重要途径,尤其受到年轻人的欢迎.与常规的文本不同,弹幕文本普遍较短,表达随意,网络词汇较多,一些常规的停用词被用于表达情感.提出了一种基于弹幕数据的舆情分析模型,针对弹幕数据生成和存储特点,提出了热点检测循环自适应弹幕数据获取算法;扩充了情感词典来区分弹幕中情感倾向数据和中性数据,以解决弹幕中出现的网络词汇较多的问题;基于卷积神经网络(Convolutional Neural Network, CNN)建立了情感褒贬分类模型,用来区分情感倾向弹幕的正负情感倾向,在此基础上得到了舆情分析的结果.实验表明,本文的舆情分析模型能有效地表达新闻类弹幕数据的舆情分析结果.(本文来源于《华东师范大学学报(自然科学版)》期刊2019年03期)

张天澍[7](2019)在《基于改进SVM算法的大规模中文网站分类系统实现》一文中研究指出随着互联网的发展,人们对于网站检索的需求日益增大。将网站进行分类可以极大地提升检索效率,研究中文网站的自动分类技术具有较高的实用价值。基于网页关键词词频的支持向量机SVM算法是解决高维特征向量分类问题的最好方案之一,需要设定的参数较少且具有出色的学习能力。目前SVM算法已经应用于各类网站分类工作,但因分类信息老旧,效率低下,更新速度慢等种种问题,无法完成对目前数百万的庞大的中文网站的大范围覆盖。针对上述问题,本课题对SVM机器学习模型进行了改进以解决大规模中文网站分类的问题,并基于上述方法实现针对百万规模数据集的国内中文网站的分类系统。本课题针对百万数据量下的网站分类准确率进行了相关探索,研究SVM算法相关参数对分类准确率的影响。针对传统SVM算法中存在的非均衡样本集对分类准确率产生影响的问题,本论文对算法模型进行调整,通过引入新的参数控制模型的超平面位置,将超平面向正类样本靠近,为负类样本留出更大的存在可能性空间,从而缓解非均衡样本集对分类准确率带来的影响。通过对照实验测试,改进的算法应用于非均衡样本集时,在一定的参数取值范围内对于负类样本的分类准确率有了较为明显的提高,从而提升了整体的分类效果。基于以上改进的SVM算法,本课题构建了大规模中文网站分类系统用以完成国内百万数量级规模的网站分类工作。系统包括数据采集、数据处理与存储、数据计算、数据分类、结果展示与查询这五大基本模块,完成了从网站信息爬取、信息存储、数据预处理到算法测试调优,再到算法应用及结果展示的一体化分类工作。系统模块经过测试,满足了应用需求,取得了不错的分类效果。(本文来源于《北京邮电大学》期刊2019-05-20)

于万金[8](2019)在《基于深度学习的大规模多标签图像分类方法研究》一文中研究指出创造拥有自我意识,能够自主思考的人工智能,是当前人们为之奋斗的梦想。人工智能当下十分关键的任务,便是教会计算机去辨别和明白图像。一方面,图像构建了我们认知世界、改变世界的根基,这项技术能够让计算机能够有效的理解自然界中最普遍的信息,更好的理解用户;另一方面,受益于计算机视觉技术,人们可以清楚的理解并表达图像所传递出的语义信息,可以更好地协助人们相互沟通与交流,对改善人们日常生活与推动社会进步有着极大的帮助。图像分类是计算机视觉领域中的一个极其重要的,同时也是根本的研究问题。图像分类作为根基,构成了其他计算机视觉任务的基础,如目标定位、检测和实例分割等。根据与每个图像相关联的标签的数量,图像分类问题可以分为两类:单标签图像分类和多标签图像分类。在过去的几十年中,单标签图像分类方法已经被广泛研究。在近些年来,受益于深度卷积神经网络的成功,深度单标签方法已经显示出显着的性能增益,胜过使用手工制作特征的传统方法。多标签图像分类问题,旨在解决一个图像同时与多个标签关联的场景。在现实生活中,多标签问题出现普遍,并且比单一标签更复杂,因此在实践活动中更具有挑战性。本文的工作是基于深度学习的大规模多标签图像分类方法研究。近年来,基于深度学习的多标签分类方法已经表现出良好的性能,然而,依然存在不少需要进一步探究的问题。首先,在具有多个标签的图像中,对象通常位于图像中的不同位置,并且具有差异的大小和形式。因此,有些直接使用预先训练的深度神经网络提取的全局特征进行学习的方法,可能导致多标签图像分类结果的次优性能。其次,有些标签与整个图像关联,而不仅仅是与一个小区域相关联。因此,有些仅仅利用深层局部特征的方法可能忽略了图像的全局信息,并且不能正确地学习到与多个对象甚至整个图像相关联的标签信息。最后,有些方法试图将全局特征和局部信息同时结合起来,但是通常无法提取足够好的全局和局部特征信息,并且无法有效地结合这些特性。考虑到上述的问题,为了能够提取和充分利用这些信息,本文提出了一种新的深度双流神经网络,用于解决多标签图像分类任务,简称DELTA。如其名称所示,它由两个部分组成,即多示例网络和全局先验网络。具体来说,在多示例网络中,我们提出了一种设计良好的空间金字塔卷积传输层来提取多尺度的示例,通过使用共享特征的卷积层计算,有效地提取多尺度的示例特征;然后,它结合子概念层,将标签分解为子概念,并学习一个用于匹配示例和子概念之间得分的评分函数;最后,一个包含平均池化层和Log-Sum-Exp池化层的多示例池化层被利用来对子概念和示例进行聚合。在全局先验网络中,我们从整个图像中捕获全局先验特征。模型的最后,为了进行最终的多标签预测,我们将两个网络的输出通过融合层进行组合,以获得更全面的标签预测分数。我们在叁个基准数据集(即Pascal VOC 2007、Pascal VOC 2012和Microsoft COCO)进行对比实验,通过实验结果表明,DELTA与其他深度多标签分类方法相比,性能有了显着的提升。此外,DELTA可以自动定位图像中和标签关联的关键部分。(本文来源于《山东大学》期刊2019-05-20)

朱建林,陈忠阳,张永俊,孙存一[9](2019)在《基于全路径相似度的大规模层次分类算法》一文中研究指出为快速准确地实现大规模层次分类问题,提出词类区分度概念,并以此作为计算类向量的基础。基于类向量,以改进的Rocchio算法计算待分类文本与目标类的相似度,候选出N个最可能的目标类别;根据目标类别的层次拓扑结构,计算待分类文本与N个目标类别的全路径相似度,确定分类类别。实验结果表明,该方法分类效果优于传统算法,其基于文本类全路径相似度的策略明显改善了单纯基于词类区分度的分类算法。(本文来源于《计算机工程与设计》期刊2019年05期)

肖茹[10](2019)在《基于改进栈式核稀疏深度模型的大规模极化SAR地物分类算法》一文中研究指出地物分类是极化SAR应用的一个重要分支。传统的地物分类方法需要提取特征,通过分类器进行分类。在栈式稀疏自编码模型的基础上,提出一种鲁棒的极化SAR地物分类算法。采用基于Morlet小波核的最小二乘支撑向量机代替深度模型中常用的Softmax分类器。通过与栈式稀疏自编码网络相结合,在一定程度上克服了传统极化SAR影像地物分类方法受相干斑噪声影响,且结果过于粗糙的缺点,保证了分类结果中非匀质区域的连贯性和匀质区域的一致性。真实极化SAR数据仿真实验结果表明,该算法可以有效地提高分类精度,降低相干斑噪声的对分类精度的影响。(本文来源于《计算机应用与软件》期刊2019年05期)

大规模分类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对大规模MIMO通信系统中存在的导频污染问题,提出了一种基于用户位置和用户分类的导频分配方案。该方案根据路径损耗和到达角设计目标函数及合理阈值,通过将用户的目标函数与阈值进行比较,把系统中所有用户分为高干扰和低干扰两类,接着为低干扰用户复用导频序列、高干扰用户分配额外正交导频序列来减轻导频污染。仿真结果表明,该方案提高了通信系统性能。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

大规模分类论文参考文献

[1].任佳丽,王文晶.基于差分孪生卷积神经网络的大规模不平衡数据分类算法[J].计算机应用与软件.2019

[2].曹海燕,马子昌,杨晓慧,胡文娟,许方敏.大规模MIMO系统中基于用户位置和用户分类的导频分配[J].电信科学.2019

[3].何昕.分清轻重缓急提高急救效率——大规模伤亡中的检伤分类[J].轻兵器.2019

[4].文灿,毛洋青.深圳:以绿色发展理念推进垃圾分类[N].深圳商报.2019

[5].彭金冀.大规模短文本分类系统的设计与实现[D].北京邮电大学.2019

[6].叶健,赵慧.基于大规模弹幕数据监听和情感分类的舆情分析模型[J].华东师范大学学报(自然科学版).2019

[7].张天澍.基于改进SVM算法的大规模中文网站分类系统实现[D].北京邮电大学.2019

[8].于万金.基于深度学习的大规模多标签图像分类方法研究[D].山东大学.2019

[9].朱建林,陈忠阳,张永俊,孙存一.基于全路径相似度的大规模层次分类算法[J].计算机工程与设计.2019

[10].肖茹.基于改进栈式核稀疏深度模型的大规模极化SAR地物分类算法[J].计算机应用与软件.2019

标签:;  ;  ;  ;  

大规模分类论文-任佳丽,王文晶
下载Doc文档

猜你喜欢