特征表达式论文-桂思思,陆伟,张晓娟

特征表达式论文-桂思思,陆伟,张晓娟

导读:本文包含了特征表达式论文开题报告文献综述及选题提纲参考文献,主要关键词:时态意图,有监督分类,半监督分类,特征抽取

特征表达式论文文献综述

桂思思,陆伟,张晓娟[1](2019)在《基于查询表达式特征的时态意图识别研究》一文中研究指出【目的】针对时态意图识别问题,探讨可抽取查询表达式特征的有效性及采用不同类别分类算法的识别准确度,为后续相关研究提供一定的借鉴。【方法】按查询表达式特征与时间的关联性,将其归类为时间无关特征、潜在时间特征、显式时间特征。在此基础上,分别采用有监督分类算法及半监督分类算法,探讨采用不同特征组合的有效性及不同分类算法的识别准确度。【结果】在抽取的叁类查询表达式特征中,仅使用显式时间特征的平均分类准确率最高,且"查询是否包含年份"这一特征为强特征;使用不同分类算法的识别准确度相差不大;时态意图识别结果优于已有参与时态意图分类子任务(TQIC)测评的成果,平均分类准确率为81.14%。【局限】限于数据集的获取途径,仅对300条查询的时态意图识别效果进行验证;仅考虑已有的查询表达式特征,未提出用于时态意图识别的新特征。【结论】查询表达式特征中与时间关联性高的特征能提高时态意图识别准确度,而基于统计的特征(如查询词长度)对时态意图识别分类准确度的提升效果不明显。(本文来源于《数据分析与知识发现》期刊2019年03期)

崔晓娟[2](2018)在《基于数学表达式特征的科技文档检索模型》一文中研究指出数学表达式是科技信息交流的重要载体和科技文献中的重要成分,但由于数学表达式有别于普通文本的特殊属性,导致目前面向普通文本的检索技术和搜索引擎难以实现以数学表达式为特征的科技文献检索,影响了科技信息的传播与交流,是目前信息检索与人工智能领域亟待解决的关键问题之一。针对上述问题,本文通过对科技文档构成元素与结构的分析,研究、设计基于数学表达式特征的科技文档检索模型,实现以数学表达式为查询语言的科技文档检索。首先,在科技文档检索特征的选择与提取阶段,提取科技文档的重要信息并组织成文档信息表及公式信息表;其次,在科技文档索引阶段,利用文档特征信息和文档内公式特征信息以及利用数学公式解析算法得到的数学表达式的子式信息,采用分层索引思想构建科技文档索引表与子式索引表;然后,在检索阶段,根据数学查询表达式的特征信息构建特征向量,设计了精确匹配、包含匹配和相似匹配等匹配模式检索出符合要求的科技文档结果集;最后,根据查询项出现在文档不同区域的重要程度以及与查询式的匹配程度,结合tf-idf加权方法,采用余弦相似度进行科技文档的相似度计算,得到有序的科技文档检索结果。实验结果表明,该模型实现了以数学表达式为特征对科技文档进行检索的目标。(本文来源于《河北大学》期刊2018-05-01)

芦兵,孙俊,许晓东[3](2018)在《基于正则表达式的图像目标特征提取方法研究》一文中研究指出针对图像匹配过程中生成匹配模板复杂度高的问题,根据应用场景下被识别物轮廓、颜色和空间相对位置等物理特征不变的特性,通过建立基于颜色、线条、位置等信息的基础像元素库,并利用正则表达式的组织语法对这些基础元素进行先验知识的有序组织,赋予它们描述待匹配目标匹配特征的能力,从而能够快速构建出被识别物的匹配模板,缩短图像识别过程中模板生成时间,提高图像识别效率。实验结果表明:基于正则表达式特征提取的目标识别方法能够快速、准确对目标进行识别。在固定视角下其识别率为87.5%,平均识别时间为60.3 ms。相比较于尺度不变特征变换(SIFT)和加速鲁莽特征(SURF)算法,该算法在固定视角下的识别精度和识别效率均有所提高。(本文来源于《计算机应用与软件》期刊2018年04期)

王念良[4](2017)在《短区间特征和的一些表达式》一文中研究指出研究了二次域实特征对应的短区间加权特征和的性质,用解析方法给出了二次域实特征对应的1/2,1/4短区间和的表达式,这些公式对研究某些特殊函数的性质有积极作用。(本文来源于《商洛学院学报》期刊2017年06期)

田学东,崔晓娟[5](2017)在《基于数学表达式特征的科技文档检索模型》一文中研究指出现有全文检索技术多是以文本信息为处理对象,对于以数学表达式为主要成分的科技文档检索还处在探索阶段.为了使用户可以方便地以数学公式作为查询语言对科技文档进行检索,提出了一种基于数学表达式特征的科技文档检索模型.首先通过将公式解析为二叉树得到数学表达式的子式信息,利用数学表达式及子式构造检索特征向量;在索引阶段,利用所提取的文档特征向量构建分层结构的索引表;在匹配阶段,对文档向量采用tf-idf进行加权操作,利用余弦相似度对检索向量和文档向量进行相似度计算,得到一个有序的文档检索结果.实验选取了来自不同领域的期刊、学术网站以及公共数据集的5 017篇科技文档,其中包含了96 362条数学公式,平均检索时间为0.428s,表明该模型达到了实现较高效率科技文档检索的目标.(本文来源于《河北大学学报(自然科学版)》期刊2017年06期)

吴澄[6](2017)在《基于涉华英语语料库的中国特色词英语表达式的特征和形成机制研究》一文中研究指出中国特色词负载着中国文化信息和鲜明的民族文化特征,因而了解并掌握其英语表达式对帮助中国文化“走出去”和促进中国文化软实力的构建有着重要意义。当前的研究都将中国特色词英语表达式的形成归为普通的翻译方法,且都是个案研究,缺乏对它们的特征和形成机制的系统研究。此外,现有汉英词典的编纂也没有基于语料库事实,所以它们在中国特色词英语表达式的收录、排列和表述上存在明显缺陷。本文将基于涉华英语语料库,分析中国特色词英语表达式的特征和形成机制,并将相关发现应用于汉英词典。本研究采用基于语料库以及定量定性相结合的研究方法。通过语料库语言学方法从语料库中提取了1182个中国特色词英语表达。首先,本研究分析了这些英语表达式的语义分布和语言学特征。然后,以仿造翻译为理论依据,本研究解释了它们具体的形成机制。最后结合语料库事实说明了汉英词典中中国特色词英语表达式处理上存在的缺陷,并探讨了中国特色词英语表达式在汉英词典中的应用。本研究发现:1)中国特色词英语表达式有其特有的语言学特征和形成机制,且两者之间有密切联系;2)仿造翻译是形成中国特色词英语表达式的最佳方法,通过仿造翻译形成的英语表达式有利于中国文化的对外传播和跨文化交流;3)尽管不同类别的中国特色词英语表达式有不同的形成机制,但最常用的形成机制是语音仿造和指称仿造;4)汉英词典中的中国特色词英语表达式在选词、排序和表述上存在缺陷的原因在于他们不是从实际中来,缺少语料库数据支撑;5)涉华英语语料库中的英语表达式不同程度体现了中国特色和中国文化,具有理据性和真实性,可以运用于汉英词典编纂。(本文来源于《广东外语外贸大学》期刊2017-05-08)

李晓雨[7](2017)在《融入数学表达式特征的科技论文个性化推荐》一文中研究指出为了解决科研人员在科技论文的检索中会遇到的问题,科技论文的个性化推荐研究成了热门之一。针对现在数学表达式对科技信息发展的重要性,为了提高科技论文推荐的准确性,本文提出一种在基于普通文本推荐的基础上,融入了数学表达式特征的个性化推荐方法。首先,该方法利用用户以数学表达式为关键字对论文的历史查询,对数学表达式进行特征提取,产生特征向量,为论文相似度的计算打下基础。然后,对用户下载的论文和用户的历史查询进行分析,利用本体知识和特征向量形成用户的兴趣模型,找到相似用户。最后,设计推荐算法,将认为对用户可能有用的论文推荐给用户。本文最后根据推荐系统的评价指标召回率、精确率和F1_Measure指标对本文提出的推荐方法进行度量,验证了本文方法的有效性。(本文来源于《河北大学》期刊2017-05-01)

高源,席耀一,李弼程,李苏奕[8](2016)在《基于词典特征优化和依存关系的中文时间表达式识别》一文中研究指出提出一种基于词典特征优化和依存关系的时间表达式识别方法。首先针对中文文本时间表达式边界定位不准确及长距离依赖的问题,优化了传统时间词典特征,将时间词典分为时间词词典和时间单位词典;其次针对传统基于机器学习的时间表达式识别方法忽视时间表达式本身结构特点的问题,在优化后的词典特征的基础上提取依存特征,挖掘时间表达式的结构信息;最后综合时间表达式的基本特征、词典特征和依存特征,在条件随机场模型上完成时间表达式识别。在中文语料上进行实验,时间表达式识别达到较好效果。(本文来源于《信息工程大学学报》期刊2016年04期)

周南[9](2016)在《基于层次结构特征的数学表达式检索模型》一文中研究指出数学表达式是科技信息的重要表达形式,实现数学表达式检索有助于科技信息的高效交流与利用。针对数学表达式复杂二维结构特性所导致的普通文本检索技术难以对其进行检索的问题,提出一种面向表达式层次结构的分层索引模型和检索方法。在数学表达式索引研究中,通过提取数学表达式基线层次结构,定义表达式主层次并以各表达式主层次结构信息为依据,对数学表达式资源进行聚类处理,形成具有相同主层次结构的表达式集合;基于此集合,运用Treap数据结构建立数学表达式索引,成为表达式索引层。同时,结合文件倒排记录构造文件索引层,从而建立了面向数学表达式匹配和面向文档信息获取的双层索引结构。在与该分层索引模型相应的检索方法研究中,设计了包括精确匹配和结构匹配等数学表达式查询方式的检索算法。通过实验对该分层索引模型和检索方法进行了验证,表明本文提出的面向数学表达式层次结构的分层索引模型和检索方法对数学表达式二维结构特性具有较好的有效性和适应性。(本文来源于《河北大学》期刊2016-05-01)

王国杰,郑建岚[10](2014)在《水泥基材料绝热温升曲线特征及速率表达式》一文中研究指出对4种类型的水泥基材料进行绝热温升试验,提出绝热温升各阶段分界点的确定方法,分析各阶段持续时间和温升速率大小等规律,并对已有的最终温升预测方法进行修正.最后在分析不同类型水泥基材料绝热温升规律的基础上,提出一种通用的水泥基材料绝热温升速率表达式,用于描述绝热温升速率随龄期的变化.所提出的表达式形式简单,各参数具有较为明确的物理意义,与已有模型的表达式相比,在对早龄期绝热温升和温升速率的描述方面具有更好的效果.(本文来源于《建筑材料学报》期刊2014年05期)

特征表达式论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

数学表达式是科技信息交流的重要载体和科技文献中的重要成分,但由于数学表达式有别于普通文本的特殊属性,导致目前面向普通文本的检索技术和搜索引擎难以实现以数学表达式为特征的科技文献检索,影响了科技信息的传播与交流,是目前信息检索与人工智能领域亟待解决的关键问题之一。针对上述问题,本文通过对科技文档构成元素与结构的分析,研究、设计基于数学表达式特征的科技文档检索模型,实现以数学表达式为查询语言的科技文档检索。首先,在科技文档检索特征的选择与提取阶段,提取科技文档的重要信息并组织成文档信息表及公式信息表;其次,在科技文档索引阶段,利用文档特征信息和文档内公式特征信息以及利用数学公式解析算法得到的数学表达式的子式信息,采用分层索引思想构建科技文档索引表与子式索引表;然后,在检索阶段,根据数学查询表达式的特征信息构建特征向量,设计了精确匹配、包含匹配和相似匹配等匹配模式检索出符合要求的科技文档结果集;最后,根据查询项出现在文档不同区域的重要程度以及与查询式的匹配程度,结合tf-idf加权方法,采用余弦相似度进行科技文档的相似度计算,得到有序的科技文档检索结果。实验结果表明,该模型实现了以数学表达式为特征对科技文档进行检索的目标。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

特征表达式论文参考文献

[1].桂思思,陆伟,张晓娟.基于查询表达式特征的时态意图识别研究[J].数据分析与知识发现.2019

[2].崔晓娟.基于数学表达式特征的科技文档检索模型[D].河北大学.2018

[3].芦兵,孙俊,许晓东.基于正则表达式的图像目标特征提取方法研究[J].计算机应用与软件.2018

[4].王念良.短区间特征和的一些表达式[J].商洛学院学报.2017

[5].田学东,崔晓娟.基于数学表达式特征的科技文档检索模型[J].河北大学学报(自然科学版).2017

[6].吴澄.基于涉华英语语料库的中国特色词英语表达式的特征和形成机制研究[D].广东外语外贸大学.2017

[7].李晓雨.融入数学表达式特征的科技论文个性化推荐[D].河北大学.2017

[8].高源,席耀一,李弼程,李苏奕.基于词典特征优化和依存关系的中文时间表达式识别[J].信息工程大学学报.2016

[9].周南.基于层次结构特征的数学表达式检索模型[D].河北大学.2016

[10].王国杰,郑建岚.水泥基材料绝热温升曲线特征及速率表达式[J].建筑材料学报.2014

标签:;  ;  ;  ;  

特征表达式论文-桂思思,陆伟,张晓娟
下载Doc文档

猜你喜欢