导读:本文包含了语义文本校对论文开题报告文献综述及选题提纲参考文献,主要关键词:特征提取,特征检测,文本校对,模糊匹配
语义文本校对论文文献综述
海朝阳[1](2019)在《文本语义特征检测及校对研究》一文中研究指出随着新一代信息技术的快速发展和数据的爆炸式增长,人们对数据质量的追求达到了前所未有的高度。准确性是高质量数据的基本要求,如何提高准确性也是亟待解决的难题,各种“互联网+”应用中,对信息的语义表达都有着极高的规范化要求。然而,仅仅凭借人力难以胜任大数据量的规范性检查和处理,检查效果缺乏保障。如何高效准确地提取文本的语义特征并在此基础上进行文本校对的方法研究具有重要的理论意义和实用价值。通过分析大量的文本数据发现,文本中的组成单元是词语,而每个词语都有与之相对应的词义,词语间搭配关系的正确性取决于词义间搭配关系。基于此,本文提出文本语义特征检测及校对方法,通过研究词义之间潜在的关联性,设计合理的语义特征检测方法,构建语义搭配关系表示学习模型,主要工作如下:1)结合HowNet义原知识库与语料库,分析词语-语义之间的关系。使用神经网络学习词语-义原之间的潜在映射关系,将词语在语句中的结构化表达形式转换为抽象程度更高的义原表达形式,增强语句的语义表达能力,为语义搭配关系预测模块提供便于抽象化分析的信息。2)提出一种共享隐藏信息的双层长短时记忆网络模型,将其作为集成算法的子模型构建出语义级搭配关系预测模型。该长短时记忆网络模型可以在保证模型预测能力的基础上,减少冗余信息,提高训练效率。由于语言的上下文对应关系并非一一对应,为提高模型的整体预测能力,采用集成算法将多个子模型集成,利用子模型间的差异性,扩大集成模型对上下文信息的预测范围,完成文本的语义搭配关系预测。3)提出一种结合互信息和聚合度的PDI评价方法。为保证校对准确率,降低噪点数据对校对结果的影响,结合模糊匹配方法,对生成的校对建议投票,根据投票结果对候选的校对建议降序排序,并依据邻接义原和候选校对建议集合的匹配程度判断序列是否存在语义错误,将排名靠前的校对建议作为输出信息。(本文来源于《郑州大学》期刊2019-05-01)
骆卫华,罗振声,龚小谨[2](2003)在《中文文本自动校对的语义级查错研究》一文中研究指出目前中文文本自动校对的研究集中在词级和句法查错两方面,语义级查错仍是其中的薄弱环节。文章讨论了中文文本自动校对中的语义错误校对技术,综合使用了基于实例、基于统计和基于规则的搭配关系进行检查,提出统计和规则相结合的校对策略,既能检查局部语义限制,也能检查长距离的语义搭配,收到了较好的效果,也为中文自动校对的发展提供了新的思路。(本文来源于《计算机工程与应用》期刊2003年12期)
语义文本校对论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
目前中文文本自动校对的研究集中在词级和句法查错两方面,语义级查错仍是其中的薄弱环节。文章讨论了中文文本自动校对中的语义错误校对技术,综合使用了基于实例、基于统计和基于规则的搭配关系进行检查,提出统计和规则相结合的校对策略,既能检查局部语义限制,也能检查长距离的语义搭配,收到了较好的效果,也为中文自动校对的发展提供了新的思路。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语义文本校对论文参考文献
[1].海朝阳.文本语义特征检测及校对研究[D].郑州大学.2019
[2].骆卫华,罗振声,龚小谨.中文文本自动校对的语义级查错研究[J].计算机工程与应用.2003