词对抽取论文-赵华,邓攀,张建伟

词对抽取论文-赵华,邓攀,张建伟

导读:本文包含了词对抽取论文开题报告文献综述及选题提纲参考文献,主要关键词:话题检测与跟踪,报道关系检测,关联词对,关系约束

词对抽取论文文献综述

赵华,邓攀,张建伟[1](2010)在《基于关联词对动态抽取的报道关系检测技术研究》一文中研究指出报道关系检测是判断随机选取的两个新闻报道是否讨论同一话题的技术。提出了一种基于关联词对动态抽取的报道关系检测方法。关联词对是指在同一篇报道中出现的满足一定关系约束的两个单词,而关系约束是指一组特征的集合。该方法认为两篇报道中出现的相同的关联词对越多,两篇报道的相似度越大。实验证明基于关联词对动态抽取的报道关系检测方法取得了非常好的效果,从而证实了所提方法的有效性。同时,实验还表明,关系约束对该方法的成功实施起着非常重要的作用。(本文来源于《计算机科学》期刊2010年06期)

孙俊[2](2009)在《词对抽取及基于网络的未登录词译文挖掘》一文中研究指出在中文信息处理领域,未登录词(OOV)的识别一直是个难点问题。而未登录词的翻译在自然语言处理的应用中是很重要的,比如在跨语言信息检索(CLIR)、问答系统(QA)中,未登录词翻译的正确性将直接影响到应用的最终性能。本文首先介绍了叁种抽取词对的方法,根据使用的语料库是否已经标注,我们把这叁种方法分别称为非监督的方法、监督的方法和半监督的方法。对于抽取得到的词对,我们采用了十二种基于频度的量度和两种基于上下文相似度的量度进行了关联度测量。实验结果表明:采用半监督的方法,简单地利用频度进行关联度打分,抽取词对的效果是最优的。基于网络的未登录词译文挖掘是本文的研究重点。首先对未登录词进行分类,分为直译词或非直译词,并进行英文扩展(根据分类结果分别进行直接扩展或共现扩展);再将未登录词与扩展后的英文一起放入搜索引擎进行搜索,然后从搜索引擎返回的结果页面中挖掘未登录词的译文。挖掘时先对返回的结果进行预处理,过滤掉一些干扰信息,然后抽取出其中的候选译文;再选用频度、距离等信息对候选译文进行排序。为了使正确的译文排在较前的位置,我们还采用了正向最大匹配加权和词汇对齐技术对候选译文进行打分和重排序。实验表明,本文介绍的未登录词译文挖掘方法是可行的、高效的,译文挖掘的Top 1覆盖率在80%以上,Top 5覆盖率接近或达到了100%。(本文来源于《苏州大学》期刊2009-05-01)

常宝宝[3](2003)在《基于统计的翻译等价词对抽取研究》一文中研究指出对利用汉英双语语料进行翻译等价词对抽取进行了探索 .对不同的词对关联度量方法进行了对比 ,考察了词性信息、多词翻译单元识别对翻译等价词对抽取结果所可能产生的改进以及负面影响 .(本文来源于《计算机学报》期刊2003年05期)

词对抽取论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在中文信息处理领域,未登录词(OOV)的识别一直是个难点问题。而未登录词的翻译在自然语言处理的应用中是很重要的,比如在跨语言信息检索(CLIR)、问答系统(QA)中,未登录词翻译的正确性将直接影响到应用的最终性能。本文首先介绍了叁种抽取词对的方法,根据使用的语料库是否已经标注,我们把这叁种方法分别称为非监督的方法、监督的方法和半监督的方法。对于抽取得到的词对,我们采用了十二种基于频度的量度和两种基于上下文相似度的量度进行了关联度测量。实验结果表明:采用半监督的方法,简单地利用频度进行关联度打分,抽取词对的效果是最优的。基于网络的未登录词译文挖掘是本文的研究重点。首先对未登录词进行分类,分为直译词或非直译词,并进行英文扩展(根据分类结果分别进行直接扩展或共现扩展);再将未登录词与扩展后的英文一起放入搜索引擎进行搜索,然后从搜索引擎返回的结果页面中挖掘未登录词的译文。挖掘时先对返回的结果进行预处理,过滤掉一些干扰信息,然后抽取出其中的候选译文;再选用频度、距离等信息对候选译文进行排序。为了使正确的译文排在较前的位置,我们还采用了正向最大匹配加权和词汇对齐技术对候选译文进行打分和重排序。实验表明,本文介绍的未登录词译文挖掘方法是可行的、高效的,译文挖掘的Top 1覆盖率在80%以上,Top 5覆盖率接近或达到了100%。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

词对抽取论文参考文献

[1].赵华,邓攀,张建伟.基于关联词对动态抽取的报道关系检测技术研究[J].计算机科学.2010

[2].孙俊.词对抽取及基于网络的未登录词译文挖掘[D].苏州大学.2009

[3].常宝宝.基于统计的翻译等价词对抽取研究[J].计算机学报.2003

标签:;  ;  ;  ;  

词对抽取论文-赵华,邓攀,张建伟
下载Doc文档

猜你喜欢