向量扩展论文-吕建新,郑伟,马林,李明,谷翠梅

向量扩展论文-吕建新,郑伟,马林,李明,谷翠梅

导读:本文包含了向量扩展论文开题报告文献综述及选题提纲参考文献,主要关键词:文本分类,特征选择,词频,词向量

向量扩展论文文献综述

吕建新,郑伟,马林,李明,谷翠梅[1](2019)在《基于词向量语义扩展的网络文本特征选择方法研究》一文中研究指出【目的/意义】现有特征选择方法可以计算特征所携带的类别信息量,但却不能计算出与主题相关的语义信息。针对其不足,为了提高分类准确率,提出一种基于词向量语义扩展的特征选择方法。【方法/过程】该方法引入了词向量进行主题语义计算,筛选出具有类别语义信息的词条实现特征候选集的特征扩展,并采用K近邻分类方法进行分类实验。【结果/结论】实验结果显示新方法能够有效提取主题语义特征并提高分类准确率。(本文来源于《情报科学》期刊2019年12期)

薛峰,许剑东,夏帅,王东[2](2019)在《基于词向量嵌入特征扩展的学术报告分类》一文中研究指出学术报告讲座的标题属于典型的超短文本,其固有的特征稀疏问题使得在利用传统的文本分类方法对其分类时效果不佳。为解决上述问题,文章基于词向量嵌入技术,对学术报告标题进行特征词扩展。通过控制特征扩展幅度和设置词间相似度阈值,使扩展的特征词与标题特征词的内容相关,并从词性角度进一步考虑词语相似性,过滤无关特征词。实验结果表明,该方法能够有效地提高对学术报告标题短文本的分类效果。(本文来源于《合肥工业大学学报(自然科学版)》期刊2019年11期)

吴蕾,梁晓贺,乌吉斯古楞,王瑞[3](2019)在《基于词向量的检索扩展方法与农业领域实证》一文中研究指出[目的]目前,科技文献大数据中存在着主题词不规范、不统一的情况,因此在构建检索式时很难既满足查全要求,又满足查准要求。针对这一问题,本文提出了一种基于词向量的检索扩展方法,并在"基于多组学大数据的功能基因挖掘与辅助育种技术"领域进行了实验验证。[方法]首先清洗数据集,并将文本映射成词向量,一篇文章可以用其所有词向量的平均向量表示;然后用训练集中文章的平均词向量训练随机森林分类器;最后在测试集中对文本进行分类,从而得到正例数据即检索数据集。[结果]针对"基于多组学大数据的功能基因挖掘与辅助育种技术"领域构建检索式,通过对比检索式所提取的小数据集、扩展检索式数据集和该方法提取的检索数据集的主题词云并对其进行主题共现聚类,结果发现相比小数据集和扩展检索式数据集,检索数据集能够表现另外两个数据集所体现的主题词和主题聚类,同时能够展现更多属于该主题领域的主题词和主题聚类。[结论]结果表明该方法具有较好的查全性和查准性,构建了满足分析的"基于多组学大数据的功能基因挖掘与辅助育种技术"领域数据集,同时在构建其他领域数据集时具有可扩展性,在未来研究中可以被应用到其他目标领域的数据集构建中。(本文来源于《农业大数据学报》期刊2019年02期)

马路佳,赖文,赵小兵[4](2019)在《基于跨语言词向量模型的蒙汉查询词扩展方法研究》一文中研究指出跨语言信息检索指以一种语言为检索词,检索出用另一种或几种语言描述的一种信息的检索技术,是信息检索领域重要的研究方向之一。近年来,跨语言词向量为跨语言信息检索提供了良好的词向量表示,受到很多学者的关注。该文首先利用跨语言词向量模型实现汉文查询词到蒙古文查询词的映射,其次提出串联式查询扩展、串联式查询扩展过滤、交叉验证筛选过滤叁种查询扩展方法对候选蒙古文查询词进行筛选和排序,最后选取上下文相关的蒙古文查询词。实验结果表明:在蒙汉跨语言信息检索任务中引入交叉验证筛选方法对信息检索结果有很大的提升。(本文来源于《中文信息学报》期刊2019年06期)

王福斌,孙海洋,TU,Paul[5](2019)在《边缘扩展的皮带撕裂支持向量机视觉检测》一文中研究指出提出了基于视觉的皮带撕裂监测方法,并构建了皮带撕裂视觉监控系统。针对皮带输送机运行过程中由于干扰导致的图像退化,采用维纳滤波方法实现了退化图像的复原。为实时识别高速运动的皮带裂纹,采用CamShift算法对快速移动的皮带裂纹序列目标图像进行跟踪与捕捉。采用Canny算子对皮带裂纹进行边缘提取,并通过增加一个δ值,使检测到的裂纹边缘向外扩张,从而增加检测到的皮带裂纹权重,获得鲁棒性更高的边缘检测效果。最后,构建了SVM皮带裂纹预报模型,以皮带裂纹图像的像素面积及长宽比几何特征量作为模型输入量,对皮带裂纹状态进行预报。实验表明,提出的皮带撕裂检测方法是有效的。(本文来源于《中国机械工程》期刊2019年04期)

文峰,杨逢珉[6](2019)在《出口产品向量空间权重矩阵构造及扩展边际空间效应分析——基于俄罗斯农产品进口市场的实证研究》一文中研究指出空间计量经济学通过分析变量的空间效应来揭示区域经济发展规律。本文通过构造出口产品向量空间权重矩阵,选取20个国家对俄罗斯农产品出口的2007-2013年HS-6分位数据,结合传统的引力模型对俄罗斯农产品市场进行实证分析。实证结果表明,基于"出口产品向量空间权重矩阵"的空间引力计量模型提高了传统的引力模型在空间效应方面的解释能力。扩展边际不但与本国生产力等因素有关,从空间上,也与周边国家出口产品集相似度有关。(本文来源于《华东理工大学学报(社会科学版)》期刊2019年01期)

陈淑巧,邱东,江海欢[7](2019)在《一种基于词向量的模糊查询扩展方法》一文中研究指出在中文文本信息中,同一个语义往往有多种不同的表达方法,不同的个体对同一个词语理解也会有一定的偏差,这将导致在信息检索时,出现查询项与检索数据"词不匹配"的问题.虽然,模糊检索是改善这一问题的有效方法之一,但仅仅利用已知信息进行模糊检索,已不能满足充斥着大规模无标定文本信息的网络时代的检索需要.提出一个基于词向量的模糊检索查询扩展方法,通过词向量计算查询项的相似词,进而进行查询项扩展.相比与传统的模糊检索方法,在同一测试集中,基于词向量的模糊查询扩展方法测评出的查全率、查准率以及两者的调和平均数均得到了有效提升.(本文来源于《四川师范大学学报(自然科学版)》期刊2019年01期)

孟涛,王诚[8](2019)在《基于扩展短文本词特征向量的分类研究》一文中研究指出由于短文本的文档长度较短,短文本中词语的共现信息非常匮乏,造成短文本信息稀疏性问题。信息稀疏性也成为了传统主题模型在短文本上难以取得突破性进展的瓶颈之一。针对短文本分类,充分利用短文本中的每一个词语并解决其稀疏性成为关键。为了解决这一问题,基于Word2vec模型对短文本进行词嵌入扩展以解决其稀疏性,并将词向量转换成概率语义分布来测量语义关联性;针对短文本扩展后的特征向量,利用改进后的特征权重算法并引入语义相关度去处理扩展后的词特征向量。该方法可以区分出扩展后的短文本中词的重要程度,以便获得更准确的语义相关性。短文本分类研究采用KNN算法分类,实验结果表明,通过在外部语料集上学习得到的语义相关性扩展来处理短文本特征,可以有效提高短文本的分类效果。(本文来源于《计算机技术与发展》期刊2019年04期)

王仁武,陈川宝,孟现茹[9](2018)在《基于词向量扩展的学术资源语义检索技术》一文中研究指出[目的/意义]尝试以统计的方法为指导思想,探究基于词向量扩展的语义检索技术来提升学术资源的语义检索能力。[方法/过程]利用自然语言处理、文本挖掘技术,对采集来的学术资源(主要是学术论文)元数据进行预处理,结合word2vec词向量生成工具和elasticsearch全文检索引擎搭建语义检索系统,对学术资源进行语义检索的探索研究。[结果/结论]本文提出的方法能够有效提升学术信息的检索效果,一定程度上实现学术资源的语义检索,并为后续语义检索的进一步研究提供借鉴。(本文来源于《图书情报工作》期刊2018年19期)

雷朔,刘旭敏,徐维祥[10](2018)在《基于词向量特征扩展的中文短文本分类研究》一文中研究指出针对中文短文本词汇较少、噪声多、特征稀疏的特性,为了提高短文本分类精确度,提出一种基于维基百科词向量的特征扩展算法。利用维基百科语料集训练词向量,通过对文本关键词高相似度词集进行特征扩展,并将得到的文本用传统的分类器进行分类。实验结果表明,所提方法在短文本分类精确度上要优于其他的文本特征扩展算法。(本文来源于《计算机应用与软件》期刊2018年08期)

向量扩展论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

学术报告讲座的标题属于典型的超短文本,其固有的特征稀疏问题使得在利用传统的文本分类方法对其分类时效果不佳。为解决上述问题,文章基于词向量嵌入技术,对学术报告标题进行特征词扩展。通过控制特征扩展幅度和设置词间相似度阈值,使扩展的特征词与标题特征词的内容相关,并从词性角度进一步考虑词语相似性,过滤无关特征词。实验结果表明,该方法能够有效地提高对学术报告标题短文本的分类效果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

向量扩展论文参考文献

[1].吕建新,郑伟,马林,李明,谷翠梅.基于词向量语义扩展的网络文本特征选择方法研究[J].情报科学.2019

[2].薛峰,许剑东,夏帅,王东.基于词向量嵌入特征扩展的学术报告分类[J].合肥工业大学学报(自然科学版).2019

[3].吴蕾,梁晓贺,乌吉斯古楞,王瑞.基于词向量的检索扩展方法与农业领域实证[J].农业大数据学报.2019

[4].马路佳,赖文,赵小兵.基于跨语言词向量模型的蒙汉查询词扩展方法研究[J].中文信息学报.2019

[5].王福斌,孙海洋,TU,Paul.边缘扩展的皮带撕裂支持向量机视觉检测[J].中国机械工程.2019

[6].文峰,杨逢珉.出口产品向量空间权重矩阵构造及扩展边际空间效应分析——基于俄罗斯农产品进口市场的实证研究[J].华东理工大学学报(社会科学版).2019

[7].陈淑巧,邱东,江海欢.一种基于词向量的模糊查询扩展方法[J].四川师范大学学报(自然科学版).2019

[8].孟涛,王诚.基于扩展短文本词特征向量的分类研究[J].计算机技术与发展.2019

[9].王仁武,陈川宝,孟现茹.基于词向量扩展的学术资源语义检索技术[J].图书情报工作.2018

[10].雷朔,刘旭敏,徐维祥.基于词向量特征扩展的中文短文本分类研究[J].计算机应用与软件.2018

标签:;  ;  ;  ;  

向量扩展论文-吕建新,郑伟,马林,李明,谷翠梅
下载Doc文档

猜你喜欢