导读:本文包含了标点加注论文开题报告文献综述及选题提纲参考文献,主要关键词:语音识别,关键字提取,标点加注,FTW-TF-IDF
标点加注论文文献综述
缪辉[1](2016)在《基于关键字提取及标点加注技术的口述病历识别系统设计与实现》一文中研究指出目前医生诊断时病历书写多采用手写方式,这大大降低了医生诊断效率。由此提出了采用语音识别方式来提高病历书写效率的方案。但是现有语音识别系统对识别文本很不友好,无法让人直接获取关键信息,有的甚至连标点加注都没有。因此,本文研究了语音识别后文本的关键字提取和标点加注技术,并将它运用到口述病历识别系统中。该系统使医生在阅读识别后的病历文本时更方便,还能够更高效的从大量病历文本中获取当前病历的关键信息。这大大提高了医生的工作效率。本文主要内容如下:1.进行了用户需求分析。本文针对当前医生手写病历的现象做了详细的调研分析。分析结果表明,手写病历降低了医生诊断效率,当前语音识别系统对识别文本又不够友好。因此,本文提出了基于关键字提取及标点加注技术的口述病历识别系统开发需求;2.提出了新的关键字提取算法FTW-TF-IDF。本文重点研究了关键字提取算法,分析了提高提取效果的步骤重在分词与提取算法上。因此,本文将HTK分词技术应用到关键字提取流程的分词步骤,同时在改进TF-IDF算法基础上,增加了特征权重这一参数,提出了新的关键字提取算法FTW-TF-IDF。通过实验验证了新算法的合理性与优越性。本文还研究了标点加注技术,针对项目特点优化改进了标点加注技术,并实验证明了优化后的标点加注技术的合理性。3.设计与实现了基于关键字提取及标点加注技术的口述病历识别系统。系统采用了C/S架构,设计并实现了客户端的登录、录音、记录、上传和设置模块以及服务器的识别、标点加注和关键字提取模块。分析了系统安全漏洞,并采用了AES加密技术以保障系统安全。4.进行了基于关键字提取及标点加注技术的口述病历识别系统的调试与运行。调试运行结果表明,系统运行稳定,各功能满足需求,能够很好的帮助医生提高诊断效率。(本文来源于《武汉理工大学》期刊2016-04-01)
吴新林[2](2009)在《面向机器翻译的口语标点加注技术研究》一文中研究指出随着网络的飞速发展与全球经济的一体化,人们越来越重视语音机器翻译的研究与应用。口语对话语句的显着特点是没有标点符号,不能明确句子的边界及非规范语言现象。机器翻译对这样的语句翻译效果很不理想,因此,为了提高机器翻译质量,需要对口语对话语句进行预处理,而加注标点是预处理的重要组成部分。本文在分析各种统计语言模型的基础上,提出了基于最大熵的标点加注算法,主要工作如下:1、构造了可以从语料库中自动提取语言学特征的模板机制,发挥出最大熵可以灵活选取特征的优势;深入地研究了求解标点加注问题的各种模板集,并通过实验确立了处理标点加注的有效模板集。2、研究IIS参数估计算法,并在此基础上实现了带高斯先验平滑的IIS参数估计算法,有效地避免了机器学习过程的过学习现象,该算法比较高效的估算出各个语言学特征的权值而形成模型。3、研究并实现了适合于最大熵方法的单点分类解码方法,运用模型对输入序列进行预测,快速高效地获得全局最优的解码序列,从而完成标点加注工作。实验表明本文标点加注在开放测试中的F值达到87.08%,验证了标点加注算法的有效性。4、将标点加注算法集成到机器翻译系统之中,对测试语料库分别进行直接翻译与标点加注处理后翻译,通过机器翻译的自动评测工具分别评价它们的翻译效果,结果显示BLEU值由0.2257提高到0.2465,由此说明标点加注工作使机器翻译的译文质量有了比较大的改善。(本文来源于《南京理工大学》期刊2009-05-01)
路艳霞[3](2006)在《北京百种千卷旧志重见天日》一文中研究指出本报讯(路艳霞)昨天,由市地方志编纂委员会办公室、市新闻出版局主持的北京旧志整理工作全面启动。日前,由市各相关领导与北京史志专家组成的《北京旧志汇刊丛书》编纂委员会成立,这标志着建国以来系统完整、规模最大的北京旧志整理出版工作全面展开。北京旧志,指元(本文来源于《北京日报》期刊2006-10-27)
标点加注论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着网络的飞速发展与全球经济的一体化,人们越来越重视语音机器翻译的研究与应用。口语对话语句的显着特点是没有标点符号,不能明确句子的边界及非规范语言现象。机器翻译对这样的语句翻译效果很不理想,因此,为了提高机器翻译质量,需要对口语对话语句进行预处理,而加注标点是预处理的重要组成部分。本文在分析各种统计语言模型的基础上,提出了基于最大熵的标点加注算法,主要工作如下:1、构造了可以从语料库中自动提取语言学特征的模板机制,发挥出最大熵可以灵活选取特征的优势;深入地研究了求解标点加注问题的各种模板集,并通过实验确立了处理标点加注的有效模板集。2、研究IIS参数估计算法,并在此基础上实现了带高斯先验平滑的IIS参数估计算法,有效地避免了机器学习过程的过学习现象,该算法比较高效的估算出各个语言学特征的权值而形成模型。3、研究并实现了适合于最大熵方法的单点分类解码方法,运用模型对输入序列进行预测,快速高效地获得全局最优的解码序列,从而完成标点加注工作。实验表明本文标点加注在开放测试中的F值达到87.08%,验证了标点加注算法的有效性。4、将标点加注算法集成到机器翻译系统之中,对测试语料库分别进行直接翻译与标点加注处理后翻译,通过机器翻译的自动评测工具分别评价它们的翻译效果,结果显示BLEU值由0.2257提高到0.2465,由此说明标点加注工作使机器翻译的译文质量有了比较大的改善。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
标点加注论文参考文献
[1].缪辉.基于关键字提取及标点加注技术的口述病历识别系统设计与实现[D].武汉理工大学.2016
[2].吴新林.面向机器翻译的口语标点加注技术研究[D].南京理工大学.2009
[3].路艳霞.北京百种千卷旧志重见天日[N].北京日报.2006
标签:语音识别; 关键字提取; 标点加注; FTW-TF-IDF;