导读:本文包含了孤立词识别论文开题报告文献综述及选题提纲参考文献,主要关键词:机器人,图像处理,孤立词
孤立词识别论文文献综述
张忠雨[1](2018)在《基于图像处理和孤立词识别的机器人路径规划》一文中研究指出文章介绍了一种能在真实生活环境道路中操作使用的自动导向运送机器人,该机器人利用图像处理作导航,进行交通灯、斑马线的检测和车道跟踪,在图像处理失败时利用孤立词语音识别算法使人与机器人通过语言进行沟通交流指挥该机器人运送,能够可靠地作为无人驾驶运输工具,代替人类完成有害的工作。(本文来源于《邢台职业技术学院学报》期刊2018年05期)
刘宇[2](2018)在《基于信道状态信息的中国手语孤立词识别方法研究》一文中研究指出手语识别是通过计算机技术将手语动作转换成文字或声音的技术,对辅助聋哑人与非手语人群的正常交流具有重要意义。现有的手语识别方法主要分为基于传感器和基于计算机视觉的手语识别,硬件依赖度高、设计部署要求高、维护成本高。在手语识别中,孤立词是构建连续句子的基础和前提。论文利用手语动作对无线信号传播信道产生的影响,提出基于信道状态信息的中国手语孤立词识别方法。主要研究内容包括以下四个方面。首先,提出利用小波变换和主成分分析的去噪方法并结合插值进行无线信号预处理,消除环境和商用设备内部状态改变引起的噪声,克服硬件设备造成的采样缺陷并保留所有子载波的细节特征。其次,提出基于多数据流异常检测的动作分割方案,综合分析所有数据流进行精细动作和相似动作的分割和融合,并提取融合序列的时域特征。再次,对比分析应用现有的基于信道状态信息的动作识别分类方法进行手语孤立词识别,首次采用极限学习机作为基于无线信号的无设备感知细粒度动作分类器,满足手语孤立词识别对准确性和实时性的要求。最后,分别在会议室和实验室环境中采集不同手语动作下的信道状态信息数据,对识别方法进行验证和性能评估。实验结果显示,两种环境下本文方法的识别准确率分别达到了94.3%和91.7%。(本文来源于《燕山大学》期刊2018-05-01)
李荣华,赵征鹏[3](2017)在《衡阳方言孤立词识别研究》一文中研究指出目前,汉语识别已经取得了一定的研究成果.但由于中国的地域性差异,十里不同音,使得汉语识别系统在进行方言识别时识别率低、性能差.针对语音识别系统在对方言进行识别时的缺陷,构建了基于HTK的衡阳方言孤立词识别系统.该系统使用HTK3.4.1工具箱,以音素为基本识别单元,提取39维梅尔频率倒谱系数(MFCC)语音特征参数,构建隐马尔可夫模型(HMM),采用Viterbi算法进行模型训练和匹配,实现了衡阳方言孤立词语音识别.通过对比实验,比较了在不同因素模型下和不同高斯混合数下系统的性能.实验结果表明,将39维MFCC和5个高斯混合数与HMM模型结合实验时,系统的性能得到很大的改善.(本文来源于《计算机系统应用》期刊2017年05期)
苏洁,李余芳,郭琳,刘敬凤,潘文林[4](2015)在《HTK参数对普米语孤立词识别率的影响》一文中研究指出普米语是一种无文字的少数民族语言,目前已处于濒危状态,建立语音语料库及开展语音识别研究是保护和传承普米语的重要手段.基于HTK的语音识别中,参数的选取对不同语言的识别率有很大的影响.针对MFCC维数、HMM状态数及GMM个数这3个参数对普米语的识别率进行研究,结果表明:普米语语音识别的最佳MFCC维数为13维,最佳HMM状态数为8个,最佳GMM个数为3个.(本文来源于《云南民族大学学报(自然科学版)》期刊2015年06期)
朱健晨,刘增力,袁洪,程桐[5](2015)在《孤立词识别系统的算法改进及优化》一文中研究指出针对基本孤立词识别系统中语音信号预处理效果差、模板匹配成功率低、词汇识别耗时长等问题,基于动态时间规整算法(Dynamic Time Warping,DTW)提出了一种改进孤立词识别系统。首先,通过仿真设置合理的帧长和帧移数,并利用改进的端点检测法确定语音的始末端,提高了语音信号的预处理效果;其次,采用美尔倒谱系数结合一阶差分系数提取了语音信号的特征参数,从而有效降低了计算机的时间复杂度;然后,采用DTW算法有效降低了语音信号的累积失真距离,实现了对孤立词语音信号的有效识别;最后,通过计算机仿真,验证了所提出的设计及参数设置的有效性,并通过对比实验验证了设计的高效性。(本文来源于《计算机仿真》期刊2015年09期)
周娅[6](2015)在《彝语孤立词识别研究》一文中研究指出语音识别是模式识别与人工智能的研究热点之一。彝语语音识别是语音识别研究领域的一个新方向。目前,已经有英语、汉语等语音识别产品投入商用。国内对汉语音识别的研究已发展到大词汇量、连续语音和鲁棒性语音识别,相比之下少数民族语言语音识别研究却很滞后,尤其是对拥有871万(2010年统计数据)使用者的彝语,基本未见有语音识别的研究。因此,彝语语音识别研究具有重要意义,一方面使彝族同胞享受科技带来的便利,促进各民族的交流与共同发展;另一方面可以更好地传承彝族优秀文化,提升我国文化底蕴。本文在详细分析彝语特点、彝语音信号预处理技术后,对彝语音信号的特征参数做了深入探讨,尤其是经典的线性预测倒谱系数和梅尔频率倒谱系数。比较了不同阶数的线性预测倒谱系数和梅尔频率倒谱系数及其差分参数对本文研究的彝语孤立词识别系统识别率的影响。实验结果表明,12阶梅尔频率倒谱系数具有最高的识别率,最适合作为本文研究系统的特征参数。支持向量机在小样本的现实条件下相比于隐马尔科夫模型、人工神经网络等常用的语音识别算法具有更好的泛化能力和分类正确率,且其通过引入核函数可以较好地解决线性不可分问题。最小二乘支持向量机与标准支持向量机相比,将凸二次规划的求解转化为解线性方程,具有更快地收敛速度从而减少了求解时的资源占用,并且通过采用最小二乘支持向量机对汉语语音进行识别,验证了其在语音识别系统中的有效性,因此本文尝试使用最小二乘支持向量机作为识别算法。此外本文采用识别率、识别时间和模型训练时间叁个指标对比了几种核函数在本文所研究系统中的性能,结果表明高斯核函数具有较好地表现,在此基础上,引入动态时间规整算法对高斯核函数进行了改进,实验结果表明,改进的高斯核函数在特定的实验环境下具有更好的性能。(本文来源于《昆明理工大学》期刊2015-05-01)
李丽[7](2015)在《基于嵌入式的一种快速孤立词识别方法研究与应用》一文中研究指出要让机器“听懂”人的说话,首先必须进行语音识别,所以语音识别技术是智能技术中的一个重要分支。随着HMM理论的相对成熟,语音识别技术也逐渐走入人们的生活,然而后续的理论发展缓慢,昂贵的语音识别芯片,影响了语音识别技术的推广,现在我们面临的问题主要有:第一,语音特征参数提取的不准确;第二,语音识别模型过于复杂化。本文针对上述两个方面存在的问题,提出新的算法改进。为了研究“语音识别与何种参数相关”,做了有关的特征提取实验,将现有的时域特征、频域特征及时频域特征进行对比分析,发现时频域特征才是语音识别的特征关键,通过对时频谱的简化,得到一个新的时频特征——过零谱,再经由大量实验证明,过零谱是一种可以实现简单且识别效率高的特征函数。针对现有的语音识别模型虽精确度高但是计算复杂的特点,提出了一种高识别率,低复杂度的语音识别模型——基于超球串的仿生模式识别算法,通过反复实验,与动态时间规整(DTW)、隐马尔科夫模型(HMM)对比分析,可知仿生模式识别在算法复杂度上远远低于其他几种算法,而识别的准确率不低于其他语音识别算法。对于现有的语音识别模型,特征参数提取过程复杂,计算量大,耗时长致使在低性能的嵌入式系统上难于实现,从而导致语音芯片或语音识别系统昂贵的问题,本文通过提出了一种新的特征提取方法,并用仿生模式识别算法进行识别,经MATLAB上进行仿真结果表明,该算法运行速度快,识别率高。将该算法移植到STM32上,实现了孤立词识别。本文的研究有广泛的应用价值,随着人们对生活质量要求越来越高,也要求语音识别能够在准确率、识别速度、价格等方面获得更大的综合优势,我们在这方面的工作是一种有益的尝试。(本文来源于《上海师范大学》期刊2015-04-01)
林龙[8](2015)在《基于神经网络的孤立词识别系统在安卓平台上的实现》一文中研究指出随着人工智能和机器学习的发展,语音识别技术逐渐被应用于人类生活中的很多方面。尤其是孤立词识别,因其端点检测比较容易,系统存在问题较少,也较易实现,所以被广泛地应用于许多种场合。智能手机的异军突起,让手机的应用场景开始变得越来越复杂。但这也为孤立词识别系统提供了一个新的平台,使得其能够在很多用户无法进行手动操作的场合下大显身手,比如,行车过程中,运动过程中等等。因此在智能手机上开发一个性能稳定,识别效果较好的孤立词识别系统,对于手机的人性化、智能化和对人们生活水平的提高都有显着的促进作用。本文首先介绍了语音识别的发展现状和基本模型、识别流程、几种较为常用的语音识别算法,比较了其各自的优缺点,最终选择了人工神经网络中的BP神经网络作为语音识别的识别算法。其次,介绍了神经网络的基本原理,相应的结构、学习方式等内容,重点介绍了BP神经网络的运行原理、识别过程、局限性和实际中改进的方法。再次,介绍了Android平台的结构、性能、搭建过程、程序中所涉及的模块和一些相关工具。重点介绍本文中需要用到的JNI和NDK。最后,详细说明了本文开发孤立词识别系统的流程和思路,展示了最终实现的效果,分析了其中的不足,提出了一些改进。本文的主要研究工作如下:1.构建了孤立词识别系统所需要的样本库,并对其进行处理。样本库分为了两部分,一部分用于特定人语音识别,一部分用于非特定人语音识别。首先利用MATLAB对所采集的样本进行预处理、特征提取得到样本库的特征参数,然后对其进行规整并保存到文件中。2.利用Visual Studio平台开发一个BP神经网络模型,将所得到的特征参数输入到模型中。通过BP神经网络的学习和训练,改变模型的相关参数,比较其识别结果,最终得到识别效果最好的网络模型,将网络结构保存起来。3.在Android平台上开发相关的语音处理程序。由于Android平台提供了丰富的硬件资源,可以利用其本身的硬件开发语音采集、封装的Java程序。在对语音的处理过程中,为了保证语音识别的实时性,程序的健壮性,本文采用了C++编程对语音样本进行预处理、特征提取,确保程序运行的速度。4.将已得到的神经网络移植到Android平台上,并开发相应程序对文件进行读取,对网络进行重构,然后将语音处理程序中所得到的特征参数输入到神经网络中,最终得到识别结果。这一部分也采用的是C++编程。5.将上述的C++程序利用NDK进行编译和打包,将其制作成一个共享库加入Eclipse的工程中,这样便可以保证程序快速高效运行。然后在Android平台上开发不同识别结果所对应的一些简单手机功能,可以使得识别系统效果更加形象化,增强系统的实用性。最终将整个程序打包成.apk文件下载到手机上,进行测试。本文在最后总结了论文的工作和取得的成果,对整个系统的识别效果和性能进行一定的分析,对一些存在的漏洞和系统的局限性提出一些改进措施。实验结果表明,本系统具有一定的实用性,可以对其进一步扩展使得其可以满足更多的场景。(本文来源于《广西师范大学》期刊2015-04-01)
余炜,周娅,万代立,杨喜敬[9](2014)在《基于改进DTW的彝语孤立词识别研究》一文中研究指出彝语的语音识别与处理是语音信号处理领域的一个新方向.本文在深入分析彝语特点的基础上,对用于汉语孤立词识别的经典端点检测算法进行了改进.探讨了动态时间规整算法(Dynamic Time Warping,DTW)和高效动态时间规整算法(Efficient DTW,EDTW)在彝语孤立词识别中的应用,并提出了两种新算法:基于音节个数的动态时间规整算法(Syllable Number Based Improved DTW,SDTW)和基于音节个数的高效动态时间规整算法(Syllable Number Based Improved EDTW,SEDTW),对特定的彝语语音信号进行识别.实验结果表明,所提出的两种新算法分别在信号识别率和识别时间上比经典算法优越.(本文来源于《昆明理工大学学报(自然科学版)》期刊2014年05期)
孔荣[10](2013)在《混响环境下孤立词识别的研究》一文中研究指出语音识别系统的鲁棒性是语音识别技术能否走向实用阶段的关键,因噪声或混响的存在,特别是远程语音操作系统中,混响会引起语音信号幅值变化、相位延时、共振峰偏移以及产生其它谱峰,拖尾的混响声部分还会掩盖后面语音的弱能量音部分,大大降低了语音清晰可懂度,导致识别率下降,因此克服混响是至关重要的。本文在混响基本特性和语音识别算法的研究基础上,提出将复倒谱线性滤波和自适应U-GMM结合的算法来提高混响环境下孤立词语音的识别率,主要研究工作如下:本文重点研究了混响的特性,针对混响语音是许多时间序列迭加和纯净信号衰减的特点,依据复倒谱域纯净语音信号的复倒谱通常分布在原点附近,而房间冲击响应的复倒谱则远离原点这一特性,首先由离散傅里叶变换将语音信号变换到复倒谱域,再通过盲解卷积线性滤波滤除混响的振幅和相位信息实现混响的消减,同时不改变源语音的信息特征从而减少语音的失真。针对混响影响跨越多个连续时间帧这一问题,提出根据过去特征向量值来自适应调整高斯混合模型,并利用最大期望算法使参数达到最优估计,结合复倒谱线性滤波器,将滤波后的混响语音输入该模型进行一一匹配识别,以提高混响环境下的语音识别率。对本文方法进行了实验仿真,分别采用主客观评价指标对混响语音识别进行了评价,结果表明,本文方法得到的识别率明显高于其他常用算法,可以很好地去除混响同时保证语音失真最小。最后总结了本文所研究的工作内容,提出了本文算法存在的缺点和不足,并探讨了未来进一步研究与改进的方向。(本文来源于《苏州大学》期刊2013-05-01)
孤立词识别论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
手语识别是通过计算机技术将手语动作转换成文字或声音的技术,对辅助聋哑人与非手语人群的正常交流具有重要意义。现有的手语识别方法主要分为基于传感器和基于计算机视觉的手语识别,硬件依赖度高、设计部署要求高、维护成本高。在手语识别中,孤立词是构建连续句子的基础和前提。论文利用手语动作对无线信号传播信道产生的影响,提出基于信道状态信息的中国手语孤立词识别方法。主要研究内容包括以下四个方面。首先,提出利用小波变换和主成分分析的去噪方法并结合插值进行无线信号预处理,消除环境和商用设备内部状态改变引起的噪声,克服硬件设备造成的采样缺陷并保留所有子载波的细节特征。其次,提出基于多数据流异常检测的动作分割方案,综合分析所有数据流进行精细动作和相似动作的分割和融合,并提取融合序列的时域特征。再次,对比分析应用现有的基于信道状态信息的动作识别分类方法进行手语孤立词识别,首次采用极限学习机作为基于无线信号的无设备感知细粒度动作分类器,满足手语孤立词识别对准确性和实时性的要求。最后,分别在会议室和实验室环境中采集不同手语动作下的信道状态信息数据,对识别方法进行验证和性能评估。实验结果显示,两种环境下本文方法的识别准确率分别达到了94.3%和91.7%。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
孤立词识别论文参考文献
[1].张忠雨.基于图像处理和孤立词识别的机器人路径规划[J].邢台职业技术学院学报.2018
[2].刘宇.基于信道状态信息的中国手语孤立词识别方法研究[D].燕山大学.2018
[3].李荣华,赵征鹏.衡阳方言孤立词识别研究[J].计算机系统应用.2017
[4].苏洁,李余芳,郭琳,刘敬凤,潘文林.HTK参数对普米语孤立词识别率的影响[J].云南民族大学学报(自然科学版).2015
[5].朱健晨,刘增力,袁洪,程桐.孤立词识别系统的算法改进及优化[J].计算机仿真.2015
[6].周娅.彝语孤立词识别研究[D].昆明理工大学.2015
[7].李丽.基于嵌入式的一种快速孤立词识别方法研究与应用[D].上海师范大学.2015
[8].林龙.基于神经网络的孤立词识别系统在安卓平台上的实现[D].广西师范大学.2015
[9].余炜,周娅,万代立,杨喜敬.基于改进DTW的彝语孤立词识别研究[J].昆明理工大学学报(自然科学版).2014
[10].孔荣.混响环境下孤立词识别的研究[D].苏州大学.2013