导读:本文包含了语音文档检索论文开题报告文献综述及选题提纲参考文献,主要关键词:网格,语音文档检索,词片,特定位置后验概率网格
语音文档检索论文文献综述
郭洪禹,赵晓群,黄冬梅[1](2013)在《基于特定位置后验概率网格的开集语音文档检索》一文中研究指出提出一种以词片为识别基元的特定位置后验概率网格方法,解决了语音检索中的集外词处理问题,实现开集语音文档检索。通过引入前端查询扩展技术生成多个候选查询以补偿语音识别过程带来的误差及用户输入误差。在检索过程中引入编辑距离权重来实现模糊查询,提高系统的查全率并增强系统鲁棒性。实验表明该方法在集外词处理和系统鲁棒性等方面优于传统方法。(本文来源于《燕山大学学报》期刊2013年04期)
陆明明[2](2012)在《基于词格的语音文档检索技术研究》一文中研究指出语音文档检索是根据用户提出的查询项,在海量语音资源中搜索并返回与之相关联的语音文档或语音片段的过程,在信息安全、语音搜索引擎以及语音资源的分类管理等领域具有重要的应用价值。近年来基于Lattice的语音文档检索技术迅速发展成为了当前语音文档检索的主流技术,受到了越来越多的重视和青睐。然而,Lattice的特殊结构在包含更多正确识别结果的同时,也带来了新的问题和挑战。本文针对汉语Lattice的特点,在Lattice结构改进、最优识别单元和检索单元选取、相关文档重排序等方面开展研究,以达到加快检索速度、提高检索精度的目的,主要工作集中在以下叁个方面:(1)针对传统Lattice生成方法忽略了音位属性等语音知识的问题,提出了一种融合音位属性的Lattice结构改进方法。由于不同来源的Lattice具有信息互补性,该方法首先利用基于音位属性检测的语音识别系统建立Lattice,然后与传统自动语音识别系统生成的Lattice进行信息融合。针对融合后Lattice规模增大的问题,采用基于位置的分段对齐方法对其结构进行压缩,得到一种结构紧凑且融合音位属性的Lattice改进结构。实验结果表明,改进后的Lattice包含更多的正确识别结果,其索引覆盖率由77.83%上升到80.34%,Lattice错误率由25.31%下降到19.66%,同时有效地提高了语音检索性能。(2)针对汉语语音文档检索中最优识别单元和检索单元不一致的问题,提出了一种基于子词PSPL的语音文档索引方法。该方法首先以词为识别单元对语音文档进行解码,得到PSPL;然后对PSPL进行子词切分,并根据子词弧与原始词弧的后验概率关系,将PSPL转换为相应的子词PSPL;最后以子词PSPL作为索引进行查询项检索,实现了以词作为识别单元、子词作为检索单元的目的。实验结果表明,该检索方法在利用丰富语言信息的同时,较好地解决了词解码器存在的边界分割不正确问题,其检索性能明显优于目前普遍使用的识别单元和检索单元均为词的PSPL索引方法。(3)针对检索结果中相关文档排序不准确的问题,提出了一种基于声学特征相似度的相关文档重排序方法。该方法利用虚拟相关反馈技术对语音文档检索系统进行改进,首先从第一次检索结果中选取相关度得分较高的前N篇语音文档构成虚拟相关文档集合,然后比较检索出的语音文档和虚拟相关文档集合在查询项出现时间段内的声学特征相似度,最后对原始相关度和声学特征相似度进行融合得到新的相关度分数,并依据新的相关度分数对检索结果进行重排序。实验结果表明,重排序后的检索结果中R-准确率由69.07%上升到75.82%,同时随着迭代次数的增多,检索性能得到了进一步提升。(本文来源于《解放军信息工程大学》期刊2012-04-15)
郑铁然,韩纪庆[3](2009)在《汉语语音文档检索中后验概率的索引方法》一文中研究指出基于音节Lattice形式的语音识别结果来实现汉语语音文档检索,不但可以成功规避词表外词问题,而且Lattice这种多候选形式也能有效补偿识别错误对检索性能的影响.在基于音节Lattice的汉语语音文档检索研究中,针对已有索引方法的不足,提出了一种基于后验概率的索引方法,对向量空间模型进行改进,以音节和K步邻接音节对作为索引项,以它们在语音文档中的后验概率值作为索引项权重.检索实验表明,文中的方法更适用于基于音节Lattice的语音文档检索任务,各项改进都达到了预期效果.(本文来源于《哈尔滨工业大学学报》期刊2009年08期)
郑铁然[4](2008)在《基于音节网格的汉语语音文档检索方法研究》一文中研究指出随着计算机技术和多媒体技术的发展,被人们记录并保存在计算机中的语音数据越来越多。为了更高效地访问、管理和利用这些语音资源,必须实现基于语义内容的语音文档检索技术。所谓语音文档检索是指,根据用户输入的查询请求,在语音资源中搜索和返回与之相关联的语音段或语音文档的处理过程。语音文档检索技术与语音识别技术紧密相关,它总是利用语音识别技术为资源库建立语义层级的索引。然而,语音识别结果中普遍存在的较高的错误率和对词表外词的误识等问题也直接困扰着检索性能,研究者不得不求助于子词网格(Lattice)形式的语音识别结果,通过子词规避词表外词问题,通过Lattice这种多候选形式向检索者提供更准确的索引内容。在汉语语音文档检索研究中,采用基于音节Lattice的检索技术,业已成为了研究者们的共识。语音文档检索是一个未成熟的且极具潜力的研究领域,还存在很多问题需要解决。其中的一个核心问题就在于,Lattice并不是一个易于索引的数据形式,它的有向图结构,以及正确信息与错误信息相混杂的特点,不但直接导致了传统的检索方法性能不佳,而且也需要较大的存储开销和搜索时间。因而,研究适合音节Lattice特点的,且能够同时兼顾检索精度、索引尺寸、检索速度叁方面性能指标要求的汉语语音文档检索方法,就有着非常重要的理论意义和实用价值。本文针对音节Lattice的特点,首先研究了叁种实现机理不同、性能各有侧重的汉语语音文档检索方法,然后针对Lattice识别结果的错误率下界制约检索精度进一步提高的问题,研究了两种能够改善Lattice错误率下界的有效方法。论文的具体研究内容如下:1)提出了依赖词检出实现的语音文档检索方法,直接保存音节Lattice作为索引,并采用词检出技术来实现检索任务。提出了置信测度和发生频次相结合的相关度计算方法,提出了将传统的词检出技术拆分为离线和在线两个阶段的分解方案,从而提高了在线阶段的检索速度。该方法取得较好的检索精度,其值相当接近于在Lattice的最优候选上所得到的检索精度,但由于必须存储和搜索Lattice索引,因而索引尺寸和检索速度指标都还需要进一步的提升。针对Lattice索引尺寸较大,冗余较多的现象,提出了基于音节后验概率直方图的Lattice有效成分分析方法,研究了保留有效成分去除冗余成分的索引去冗余方法。实验结果表明,该方法能够以检索精度小幅度的下降为代价,大规模的去除索引中的冗余信息。2)提出了基于音节倒排索引的语音文档检索方法,利用倒排索引形式的特点,在保留音节Lattice主要内容的前提下,有效缩减索引尺寸。研究了通过放松匹配过程中的路径约束条件来提高检索精度的匹配机制,提出了两种有效的匹配机制:时间匹配机制和位置匹配机制。在采用位置匹配机制的检索方法中,将音节Lattice解释为具有特定位置标号的若干竞争集的级联,给出了相应的搜索匹配方法,以及匹配路径处于特定位置的后验概率值的计算方法。研究了根据音节候选在其竞争集中的名次来修正文档相关度的加权方法。实验结果表明,两种匹配机制都使检索精度有小幅度的提升,其中位置匹配机制提升更明显,且名次加权方法又进一步提高了该检索精度。提出了能够灵活控制检索速度的基于后验概率门限的剪枝方法。3)提出基于邻接音节后验概率矩阵的语音文档检索方法,旨在通过建立文档层级的索引,大规模地提升索引尺寸和检索速度指标,为实现面向大规模语音资源库的检索系统创造条件。提出了K步邻接音节对的概念,以刻画索引中音节间长距离的关联性,利用Lattice的邻接后验概率矩阵来表示Lattice的内容,进而综合各Lattice的邻接矩阵,计算邻接音节对在语音文档中的后验概率值,存储语音文档的邻接音节后验概率矩阵作为文档级索引。实验结果表明,虽然检索精度有5%左右的下降,但索引尺寸和检索速度指标都基本达到了文本检索技术的水平。研究了利用语音中韵律信息来修正文档相关度的方法,初步尝试了叁种韵律加权方法。其中能量加权方法最有效,检索精度提升了约2.7%。4)分析了制约检索精度的根本原因。提出了两种基于更低Lattice错误率下界的检索精度提高方法:一种是基于扩充Lattice的方法,另一种是基于词片语言模型的方法。前者在语音识别技术的框架之外,通过建立识别结果和识别错误之间关联关系的统计模型,并基于Dempster-Shafe证据理论,估计特定音节被识别器遗漏的概率,研究了扩充Lattice的生成方法。实验结果表明,扩充Lattice相比于原始Lattice,错误率下界下降了1.7%,检索精度提高了约4%。后者在语音识别框架内部,通过引入词片基元来改善语音识别结果的准确性,讨论了词片的概念,研究了基于最大互信息准则的词片自动选择算法,通过实验证明了引入词片有助于改善语音识别系统的识别率和检索系统的检索精度。(本文来源于《哈尔滨工业大学》期刊2008-06-01)
语音文档检索论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
语音文档检索是根据用户提出的查询项,在海量语音资源中搜索并返回与之相关联的语音文档或语音片段的过程,在信息安全、语音搜索引擎以及语音资源的分类管理等领域具有重要的应用价值。近年来基于Lattice的语音文档检索技术迅速发展成为了当前语音文档检索的主流技术,受到了越来越多的重视和青睐。然而,Lattice的特殊结构在包含更多正确识别结果的同时,也带来了新的问题和挑战。本文针对汉语Lattice的特点,在Lattice结构改进、最优识别单元和检索单元选取、相关文档重排序等方面开展研究,以达到加快检索速度、提高检索精度的目的,主要工作集中在以下叁个方面:(1)针对传统Lattice生成方法忽略了音位属性等语音知识的问题,提出了一种融合音位属性的Lattice结构改进方法。由于不同来源的Lattice具有信息互补性,该方法首先利用基于音位属性检测的语音识别系统建立Lattice,然后与传统自动语音识别系统生成的Lattice进行信息融合。针对融合后Lattice规模增大的问题,采用基于位置的分段对齐方法对其结构进行压缩,得到一种结构紧凑且融合音位属性的Lattice改进结构。实验结果表明,改进后的Lattice包含更多的正确识别结果,其索引覆盖率由77.83%上升到80.34%,Lattice错误率由25.31%下降到19.66%,同时有效地提高了语音检索性能。(2)针对汉语语音文档检索中最优识别单元和检索单元不一致的问题,提出了一种基于子词PSPL的语音文档索引方法。该方法首先以词为识别单元对语音文档进行解码,得到PSPL;然后对PSPL进行子词切分,并根据子词弧与原始词弧的后验概率关系,将PSPL转换为相应的子词PSPL;最后以子词PSPL作为索引进行查询项检索,实现了以词作为识别单元、子词作为检索单元的目的。实验结果表明,该检索方法在利用丰富语言信息的同时,较好地解决了词解码器存在的边界分割不正确问题,其检索性能明显优于目前普遍使用的识别单元和检索单元均为词的PSPL索引方法。(3)针对检索结果中相关文档排序不准确的问题,提出了一种基于声学特征相似度的相关文档重排序方法。该方法利用虚拟相关反馈技术对语音文档检索系统进行改进,首先从第一次检索结果中选取相关度得分较高的前N篇语音文档构成虚拟相关文档集合,然后比较检索出的语音文档和虚拟相关文档集合在查询项出现时间段内的声学特征相似度,最后对原始相关度和声学特征相似度进行融合得到新的相关度分数,并依据新的相关度分数对检索结果进行重排序。实验结果表明,重排序后的检索结果中R-准确率由69.07%上升到75.82%,同时随着迭代次数的增多,检索性能得到了进一步提升。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语音文档检索论文参考文献
[1].郭洪禹,赵晓群,黄冬梅.基于特定位置后验概率网格的开集语音文档检索[J].燕山大学学报.2013
[2].陆明明.基于词格的语音文档检索技术研究[D].解放军信息工程大学.2012
[3].郑铁然,韩纪庆.汉语语音文档检索中后验概率的索引方法[J].哈尔滨工业大学学报.2009
[4].郑铁然.基于音节网格的汉语语音文档检索方法研究[D].哈尔滨工业大学.2008
标签:网格; 语音文档检索; 词片; 特定位置后验概率网格;