多关键词匹配论文-陈有伟,康磊

多关键词匹配论文-陈有伟,康磊

导读:本文包含了多关键词匹配论文开题报告文献综述及选题提纲参考文献,主要关键词:电子政务,Trie树,模糊匹配,关键词匹配

多关键词匹配论文文献综述

陈有伟,康磊[1](2019)在《基于Trie树的关键词匹配算法在电子政务领域的应用》一文中研究指出传统的行政管理方式随着互联网的高速发展,其效率低下的弊端已经逐渐显露。各级部门在依托互联网快速发展的基础上积极引进现代互联网技术,结合现有行政管理的基本方式形成了符合当代环境的电子政务行政管理方式。民生诉求是电子政务的一个重要组成部分,保障和妥善解决民生问题是职能部门的重要职责,是反映其办事效率的一个窗口。然而由于民生诉求涉及到的投诉信息范围广、数量多、情况错综复杂,这给职能部门快速处理民生诉求带来了挑战。本文通过在电子政务系统中引入基于Trie树的关键词匹配算法,对市民提交的信息进行分析、匹配,从而快速分派到相应部门处理、极大地提升了各部门处理事务的效率。(本文来源于《智能计算机与应用》期刊2019年05期)

吴宇航[2](2018)在《基于深度学习的语音关键词匹配模型》一文中研究指出语音是人们日常交流活动的最基本、也是最有效的一种方式。人们希望计算机能自动完成语音识别,因此语音识别技术的发展显得非常关键。随着计算机技术、互联网和人工智能的发展,网络中产生了大量的音频等数据,对语音识别的发展产生了很大作用。当今的关键词唤醒技术开始有了大量需求,其中的代表是以Siri为代表的个人数字助理以及亚马逊的智能音箱等设备,它们唤醒时用到的唤醒词检测就用到了语音关键词匹配技术。传统的语音关键词匹配多基于传统声学模型,以隐马尔可夫模型、高斯混合模型等为代表。现在的语音识别中大量用到了以深度学习为代表的神经网络模型。本课题针对语音关键词识别问题,对传统语音匹配技术和语音信号提取进行了研究,结合深度学习和相似度匹配算法等。本课题的主要研究内容包括以下几个方面:基于语音识别的语音关键词匹配模型研究。本课题以LSTM模型为基础,用CTC算法代替传统如均方误差(MSE)损失函数,比较有效地训练模型。该LSTM+CTC的框架,模型输入语音的梅尔倒频谱系数特征,经过长短时记忆网络和全连接网络输出识别的文本字符串,再利用相似度算法对识别出的两个字符串进行比较,得到匹配结果。端到端的语音关键词匹配模型研究。端到端的模型不同于语音识别的模型,不将语音转为文本,使用特征提取网络训练得到特征图谱,再经过匹配网络比较语音之间的相似度。特征提取网络有机地结合了CLDNN和孪生神经网络,模型输入语谱图作为特征,在增加模型参数量较小的情况下,在语音关键词匹配的任务上对比CNN、LSTM等达到领先性能。模型方法横向评测。通过实验论证了基于语音识别的模型使用模糊匹配和端到端的关键词匹配模型相对当前常用的CNN、LSTM、CLDNN等模型都表现良好。语音关键词匹配在实际应用中对负例要求敏感,基于语音识别的模型使用精确匹配时能达到100%的召回率,尽管其正例的效果很不理想,端对端的关键词匹配模型随着阈值的改变能保持95%左右的召回率。可见模型可以满足实际应用的要求。(本文来源于《哈尔滨工业大学》期刊2018-06-01)

金鹏飞,牛保宁,张兴忠[3](2017)在《高效的多关键词匹配最优路径查询算法KSRG》一文中研究指出为改进基于关键词的最优路径查询算法,在大规模图以及多查询关键词下复杂度过高与可扩展性不足的缺陷,依据查询关键词序列构建候选路径的策略提出一种高效查询算法。该算法在路径构建过程中优先满足查询关键词的全包含条件,以关键词引导下的路径拓展替代盲目的邻边拓展,从而高效地构建候选路径;通过变量缩放与无效路径裁剪,将问题求解复杂度由阶乘级转化为多项式级,进一步降低算法复杂度,提升可扩展性。通过四组图数据集下的实验,验证了算法在查询效率与可扩展性上的提升。(本文来源于《计算机应用》期刊2017年02期)

程维刚,王宁,田勇[4](2015)在《基于关键词匹配技术的相似试题检测方法研究》一文中研究指出在高校题库内容重复率是评价题库建设质量的一个重要指标,为了快速找到题库中重复题或相似度很高的试题,本文主要研究了基于关键词匹配技术的相似试题检测方法 (KMQT)。该方法首先使用基于词典的分词方法将题干内容分解出若干关键词,然后利用KMP算法对关键词进行字符串匹配,最后按照匹配成功的关键词的个数对结果集进行排序。通过在题库系统中的使用,充分验证了此方法的可行性,并达到了很好的效果。(本文来源于《北华航天工业学院学报》期刊2015年03期)

石凤贵[5](2012)在《基于问题关键词匹配度的相似度计算》一文中研究指出答疑是教学中不可或缺的环节,传统面对面的答疑浪费时间和精力,因而开发高效、准确、智能化的自动答疑系统是必要的。系统返回答案的准确性在一定程度取决于问题匹配的相似度。该文介绍了智能答疑系统中传统的相似度计算,然后在传统的相似度计算的基础上提出了一种新的相似度计算方法——基于问题关键词匹配度的相似度计算,同时给出了该思想在系统中的实现算法。(本文来源于《电脑知识与技术》期刊2012年30期)

李鲲鹏,兰巨龙[6](2012)在《基于TCAM的高效浮动关键词匹配算法》一文中研究指出针对传统浮动关键词匹配算法功耗高和速率低的问题,提出一种基于叁态内容寻址寄存器(TCAM)的高效匹配算法。该算法应用关键词分类数据结构,将关键词存储在不同的TCAM模块中,并只将疑似关键词送入TCAM中查找匹配,从而减少每次访问TCAM查找的表项数目,提高一个查询周期内待匹配报文的移动速度。仿真结果表明,与传统算法相比,该算法功耗较低、匹配速度较快。(本文来源于《计算机工程》期刊2012年04期)

夏军波,庞志兵,刘东,于伟[7](2010)在《基于硬件的定长移位高速浮动关键词匹配算法》一文中研究指出针对浮动关键词匹配问题,提出了一种基于TCAM的定长移位匹配算法。该算法通过对移动步长的灵活控制有效降低了存储器的访问频率,提高了系统速率。通过分析空间复杂度,该算法与其它移位加速算法相比,在一定的范围之内对TCAM容量的需求也具有明显的优势。算法性能分析和仿真表明,该算法不仅可以实现任意长度模式的线速搜索,还可以使系统所能支持的模式集规模达到几万条。(本文来源于《计算机工程与设计》期刊2010年04期)

史乙力[8](2009)在《基于关键词匹配的网页文本过滤算法的研究和实现》一文中研究指出在互联网提供的海量、庞杂的信息中,不良信息以不同的表现形式,从不同的角度对不同人群造成毒害或干扰。因此,对网络访问进行必要的、有效的内容过滤是营造健康、安全网络环境的重要环节。基于互联网的不良信息滤技术就是在这种情况下诞生的。互联网信息过滤(Information Filtering)是指从海量的Web文本中识别出含有不良信息的非法文本,以将其屏蔽。目前它已成为信息过滤的一个新的研究领域。文本是当前Internet上信息最主要的表现形式,中文文本过滤的相关技术是本文的研究重点。本文在对信息过滤系统的体系结构和文本过滤的原型进行研究的基础上,给出了一个基于向量空间模型的文本过滤逻辑模型。中文文本的特征项抽取和表示是中文文本过滤基础。获取中文文本的表示需经过分词、停用词处理、特征项抽取和特征项权重计算等过程,本文对这几个过程进行了详细的研究并提出了一种基于TF*IDF的特征项权重计算方法。用户信息需求模型(User Profile)是文本过滤的依据,本文探讨了获取用户信息需求的方式和方法,给出了向量空间模型下用户模板的表示方法,并对用反馈技术对需求模板进行优化进行了讨论。代理服务器在Intranet管理中具有重要作用。本文基于HTTP代理服务器在应用层实现了对Web页内容的内容过滤。并且,通过将客户机成功访问过的网页内容存储在代理服务器端,实现了Web页访问的内容重现。本文在对多种信息过滤方法进行分析研究及初步评估的基础上,为提高系统过滤不良信息的整体性能和运行速度,提出二级过滤的策略:第一级基于黑白名单过滤,第二级基于关键字的文本内容的过滤。实验证明,该方法提高了文本过滤性能。(本文来源于《贵州大学》期刊2009-05-01)

贾明志,伊鹏,汪斌强[9](2008)在《一种基于Bloom filter的高速浮动关键词匹配算法》一文中研究指出目前浮动关键词模式匹配算法的性能是IP包内容检测及过滤系统的瓶颈。而现有的浮动关键词匹配模式算法存在吞吐率低或支持的关键词数量少的问题。为了解决这些问题,文中提出了一种基于Bloom filter的改进算法。对某些短模式,采用部分无状态过滤思想,使该算法具有快速、可升级、大规模、易实现的特点。仿真试验表明:只要模式出现概率小于0.01,系统吞吐率至少可以实现9Gbps的匹配速率。(本文来源于《通信技术》期刊2008年08期)

余扬武,吴顺祥[10](2008)在《基于关键词匹配的打印数据获取系统》一文中研究指出针对计算机取证中的电子证据问题,设计并实现基于关键词匹配的打印数据获取系统。通过对硬盘中假脱机文件关键词的搜索,定位打印数据所在的物理扇区并读出相关内容。性能测试显示,该系统能快速有效地获取打印内容,适用于信息保护、电子取证等环境,具有较高的实用价值。(本文来源于《计算机工程》期刊2008年11期)

多关键词匹配论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

语音是人们日常交流活动的最基本、也是最有效的一种方式。人们希望计算机能自动完成语音识别,因此语音识别技术的发展显得非常关键。随着计算机技术、互联网和人工智能的发展,网络中产生了大量的音频等数据,对语音识别的发展产生了很大作用。当今的关键词唤醒技术开始有了大量需求,其中的代表是以Siri为代表的个人数字助理以及亚马逊的智能音箱等设备,它们唤醒时用到的唤醒词检测就用到了语音关键词匹配技术。传统的语音关键词匹配多基于传统声学模型,以隐马尔可夫模型、高斯混合模型等为代表。现在的语音识别中大量用到了以深度学习为代表的神经网络模型。本课题针对语音关键词识别问题,对传统语音匹配技术和语音信号提取进行了研究,结合深度学习和相似度匹配算法等。本课题的主要研究内容包括以下几个方面:基于语音识别的语音关键词匹配模型研究。本课题以LSTM模型为基础,用CTC算法代替传统如均方误差(MSE)损失函数,比较有效地训练模型。该LSTM+CTC的框架,模型输入语音的梅尔倒频谱系数特征,经过长短时记忆网络和全连接网络输出识别的文本字符串,再利用相似度算法对识别出的两个字符串进行比较,得到匹配结果。端到端的语音关键词匹配模型研究。端到端的模型不同于语音识别的模型,不将语音转为文本,使用特征提取网络训练得到特征图谱,再经过匹配网络比较语音之间的相似度。特征提取网络有机地结合了CLDNN和孪生神经网络,模型输入语谱图作为特征,在增加模型参数量较小的情况下,在语音关键词匹配的任务上对比CNN、LSTM等达到领先性能。模型方法横向评测。通过实验论证了基于语音识别的模型使用模糊匹配和端到端的关键词匹配模型相对当前常用的CNN、LSTM、CLDNN等模型都表现良好。语音关键词匹配在实际应用中对负例要求敏感,基于语音识别的模型使用精确匹配时能达到100%的召回率,尽管其正例的效果很不理想,端对端的关键词匹配模型随着阈值的改变能保持95%左右的召回率。可见模型可以满足实际应用的要求。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

多关键词匹配论文参考文献

[1].陈有伟,康磊.基于Trie树的关键词匹配算法在电子政务领域的应用[J].智能计算机与应用.2019

[2].吴宇航.基于深度学习的语音关键词匹配模型[D].哈尔滨工业大学.2018

[3].金鹏飞,牛保宁,张兴忠.高效的多关键词匹配最优路径查询算法KSRG[J].计算机应用.2017

[4].程维刚,王宁,田勇.基于关键词匹配技术的相似试题检测方法研究[J].北华航天工业学院学报.2015

[5].石凤贵.基于问题关键词匹配度的相似度计算[J].电脑知识与技术.2012

[6].李鲲鹏,兰巨龙.基于TCAM的高效浮动关键词匹配算法[J].计算机工程.2012

[7].夏军波,庞志兵,刘东,于伟.基于硬件的定长移位高速浮动关键词匹配算法[J].计算机工程与设计.2010

[8].史乙力.基于关键词匹配的网页文本过滤算法的研究和实现[D].贵州大学.2009

[9].贾明志,伊鹏,汪斌强.一种基于Bloomfilter的高速浮动关键词匹配算法[J].通信技术.2008

[10].余扬武,吴顺祥.基于关键词匹配的打印数据获取系统[J].计算机工程.2008

标签:;  ;  ;  ;  

多关键词匹配论文-陈有伟,康磊
下载Doc文档

猜你喜欢