导读:本文包含了短文本分类论文开题报告文献综述及选题提纲参考文献,主要关键词:手机取证,中文短文本分类,神经网络
短文本分类论文文献综述
徐红,刘衍[1](2019)在《手机取证的中文短文本分类方法》一文中研究指出手机取证是打击利用手机犯罪的重要手段,手机取证面对的主要技术问题之一是中文短文本分类。文章研究手机取证的中文短文本分类,简析文本分类的流程,探讨改进普通文本分类技术以适应中文短文本分类的需求,以及将BP神经网络应用于文本分类器的设计方法。(本文来源于《科技创新与应用》期刊2019年35期)
张志远,万双双[2](2019)在《基于ConvLSTM模型的短文本情感分类研究》一文中研究指出CNN在处理短文本情感分类时,使用卷积层抽取局部特征,用最大池化层选取局部特征最大值,易忽略其长期序列特性。该文使用一种新的深度学习模型ConvLSTM,利用长LSTM替代CNN中的最大池化层,以减少局部信息的丢失并捕获句子序列中的长期依赖关系。在IMDB影评数据集和Amazon评论数据集上的实验表明,该模型较CNN和单纯的LSTM在准确率、召回率和F值等方面均有较明显的提高。(本文来源于《现代电子技术》期刊2019年22期)
文武,李培强,郭有庆[3](2019)在《基于TNG特征扩展的MLFM-MN短文本分类算法》一文中研究指出在海量短文本中由于特征稀疏、数据维度高这一问题,传统的文本分类方法在分类速度和准确率上达不到理想的效果。针对这一问题提出了一种基于Topic N-Gram(TNG)特征扩展的多级模糊最小-最大神经网络(MLFM-MN)短文本分类算法。首先通过使用改进的TNG模型构建一个特征扩展库并对特征进行扩展,该扩展库不仅可以推断单词分布,还可以推断每个主题文本的短语分布;然后根据短文本中的原始特征,计算这些文本的主题倾向,根据主题倾向,从特征扩展库中选择适当的候选词和短语,并将这些候选词和短语放入原始文本中;最后运用MLFM-MN算法对这些扩展的原始文本对象进行分类,并使用精确率、召回率和F1分数来评估分类效果。实验结果表明,本文提出的新型分类算法能够显着提高文本的分类性能。(本文来源于《计算机工程与科学》期刊2019年11期)
吴彦文,黄凯,王馨悦,林娴[4](2019)在《一种融合主题模型的短文本情感分类方法》一文中研究指出构建基于LDA主题模型和LSTM模型构建分类模型,以解决短文本情感分类问题.通过词嵌入法并融合LDA主题模型来扩展评论信息的特征表示方法以解决短文本数据稀疏,特征不明显等问题;引入LSTM构建分类模型,该模型可以记忆长程信息,通过不断学习文本上下文信息来更好地学习文本的特征信息.在评价文本数据集上作对比实验,相较于已有的模型,本文提出的情感分类模型在准确率、召回率、F1值等多个指标上具有更好的表现.(本文来源于《小型微型计算机系统》期刊2019年10期)
廖小琴,徐杨[5](2019)在《面向BSP-CNN的短文本情感倾向性分类研究》一文中研究指出针对消费短文本评论中的情感倾向性分类问题,提出了一种BSP-CNN混合神经网络模型。模型先使用双向简单循环单元(BiSRU)对数据进行特征表示,再使用逐点卷积神经网络(P-CNN)进一步学习语义特征,并输出情感倾向性分类结果。实验结果表明,与传统的长短期记忆神经网络(LSTM)和卷积神经网络(CNN)相比,BSPCNN混合神经网络模型有效简化了计算,缩短了运行时间,并且在不同大小和不同文本长度的数据集上均能取得更高的F1值。(本文来源于《计算机工程与应用》期刊2019年23期)
邵云飞,刘东苏[6](2019)在《基于类别特征扩展的短文本分类方法研究》一文中研究指出【目的】针对短文本分类中的内容稀疏问题,提出一种基于类别特征扩展的短文本分类方法。【方法】使用改进后的TF-IDF模型以及LDA主题模型构建基于类别特征的关键词集与主题分布集,完成对短文本内容及词汇向量表征上的扩充,并在此基础上通过卷积神经网络对短文本分类。【结果】实验结果表明,基于类别特征扩展后的短文本在分类的准确率上提升3%,在召回率上提升4.1%。【局限】仅使用卷积神经网络进行验证。【结论】基于类别特征扩展的短文本分类方法能够克服短文本分类中的内容稀疏问题,提高短文本分类的性能。(本文来源于《数据分析与知识发现》期刊2019年09期)
刘春磊,梁瑞斯,邸元浩[7](2019)在《基于TFIDF和梯度提升决策树的短文本分类研究》一文中研究指出自然语言处理是人工智能领域中的一个热门方向,而文本分类作为自然语言处理中的关键技术受到专家学者的广泛关注。随着机器学习技术的发展,决策树算法已经在文本分类中取得了较好的分类效果。本文针对短文本分类问题,利用TFIDF提取文本特征后,结合梯度提升决策树算法进行文本分类,并与朴素贝叶斯、逻辑回归和支持向量机的分类效果进行对比分析,验证了梯度提升决策树用于短文本分类的可行性。(本文来源于《科技风》期刊2019年24期)
马正奇,呼嘉明,龙铭,陈新[8](2019)在《运用CNN-LSTM混合模型的短文本分类》一文中研究指出针对分类短文本时卷积神经网络(CNN)只提取局部特征和长短时记忆网络(LSTM)学习计算量大、处理时间长且随着短文本文字量增加与上下文的联系会减弱的问题,给出了基于CNN-LSTM混合模型算法.该算法融合CNN对短文本的特征提取能力,降低了文本数据量;利用LSTM的记忆能力,充分学习短文本的全局特征,进而对短文本进行更加有效地分类.实验结果表明,CNN-LSTM混合模型对短文本的分类效果远远好于CNN模型和LSTM模型.(本文来源于《空军预警学院学报》期刊2019年04期)
郑诚,薛满意,洪彤彤,宋飞豹[9](2019)在《用于短文本分类的DC-BiGRU_CNN模型》一文中研究指出文本分类是自然语言处理中一项比较基础的任务,如今深度学习技术被广泛用于处理文本分类任务。在处理文本序列时,卷积神经网络可以提取局部特征,循环神经网络可以提取全局特征,它们都表现出了不错的效果。但是,卷积神经网络不能很好地捕获文本的上下文相关语义信息,循环神经网路对语义的关键信息不敏感。另外,利用更深层次的网络虽然可以更好地提取特征,但是容易产生梯度消失或梯度爆炸问题。针对以上问题,文中提出了一种基于密集连接循环门控单元卷积网络的混合模型(DC-BiGRU_CNN)。该模型首先用一个标准的卷积神经网络训练出字符级词向量,然后将其与词级词向量进行拼接并作为网络输入层。受密集连接卷积网络的启发,在对文本进行高级语义建模阶段时,采用文中提出的密集连接双向门控循环单元,其可以弥补梯度消失或梯度爆炸的缺陷,并且加强了每一层特征之间的传递,实现了特征复用;对前面提取的深层高级语义表示进行卷积和池化操作以获得最终的语义特征表示,再将其输入到softmax层,实现对文本的分类。在多个公开数据集上的研究结果表明,DC-BiGRU_CNN模型在执行文本分类任务时准确率有显着提升。此外,通过实验分析了模型的不同部件对性能提升的作用,研究了句子的最大长度值、网络的层数、卷积核的大小等参数对模型效果的影响。(本文来源于《计算机科学》期刊2019年11期)
唐贤伦,林文星,杜一铭,王婷[10](2019)在《基于串并行卷积门阀循环神经网络的短文本特征提取与分类》一文中研究指出针对短文本数据特征少、提供信息有限,以及传统卷积神经网络(convolutional neural network,CNN)和循环神经网络(recurrent neural network,RNN)对短文本特征表示不充分的问题,提出基于串并行卷积门阀循环神经网络的文本分类模型,处理句子特征表示与短文本分类。该网络在卷积层中去除池化操作,保留文本数据的时序结构和位置信息,以串并行的卷积结构提取词语的多元特征组合,并提取局部上下文信息作为RNN的输入;以门阀循环单元(gated recurrent unit,GRU)作为RNN的组成结构,利用文本的时序信息生成句子的向量表示,输入带有附加边缘距离的分类器中,引导网络学习出具有区分性的特征,实现短文本的分类。实验中采用TREC、MR、Subj短文本分类数据集进行测试,对网络超参数选择和卷积层结构对分类准确率的影响进行仿真分析,并与常见的文本分类模型进行了对比实验。实验结果表明:去掉池化操作、采用较小的卷积核进行串并行卷积,能够提升文本数据在多元特征表示下的分类准确率。相较于相同参数规模的GRU模型,所提出模型的分类准确率在3个数据集中分别提升了2.00%、1.23%、1.08%;相较于相同参数规模的CNN模型,所提出模型的分类准确率在3个数据集中分别提升了1.60%、1.57%、0.80%。与Text–CNN、G–Dropout、F–Dropout等常见模型相比,所提出模型的分类准确率也保持最优。因此,实验表明所提出模型可改善分类准确率,可实际应用于短文本分类场景。(本文来源于《工程科学与技术》期刊2019年04期)
短文本分类论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
CNN在处理短文本情感分类时,使用卷积层抽取局部特征,用最大池化层选取局部特征最大值,易忽略其长期序列特性。该文使用一种新的深度学习模型ConvLSTM,利用长LSTM替代CNN中的最大池化层,以减少局部信息的丢失并捕获句子序列中的长期依赖关系。在IMDB影评数据集和Amazon评论数据集上的实验表明,该模型较CNN和单纯的LSTM在准确率、召回率和F值等方面均有较明显的提高。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
短文本分类论文参考文献
[1].徐红,刘衍.手机取证的中文短文本分类方法[J].科技创新与应用.2019
[2].张志远,万双双.基于ConvLSTM模型的短文本情感分类研究[J].现代电子技术.2019
[3].文武,李培强,郭有庆.基于TNG特征扩展的MLFM-MN短文本分类算法[J].计算机工程与科学.2019
[4].吴彦文,黄凯,王馨悦,林娴.一种融合主题模型的短文本情感分类方法[J].小型微型计算机系统.2019
[5].廖小琴,徐杨.面向BSP-CNN的短文本情感倾向性分类研究[J].计算机工程与应用.2019
[6].邵云飞,刘东苏.基于类别特征扩展的短文本分类方法研究[J].数据分析与知识发现.2019
[7].刘春磊,梁瑞斯,邸元浩.基于TFIDF和梯度提升决策树的短文本分类研究[J].科技风.2019
[8].马正奇,呼嘉明,龙铭,陈新.运用CNN-LSTM混合模型的短文本分类[J].空军预警学院学报.2019
[9].郑诚,薛满意,洪彤彤,宋飞豹.用于短文本分类的DC-BiGRU_CNN模型[J].计算机科学.2019
[10].唐贤伦,林文星,杜一铭,王婷.基于串并行卷积门阀循环神经网络的短文本特征提取与分类[J].工程科学与技术.2019