导读:本文包含了文摘句选择论文开题报告文献综述及选题提纲参考文献,主要关键词:面向查询多文档自动文摘,关键词抽取,文摘句选择,聚类
文摘句选择论文文献综述
马亮[1](2009)在《面向查询多文档文摘的文摘句选择与排序研究》一文中研究指出互联网的飞速发展促进了信息处理技术地不断进步。面向查询的多文档自动文摘技术任务是基于特定的查询,将大量的查询结果文档中的相关内容浓缩为一个既与查询相关,并且内容简洁、满足个性化需求的文摘,它能够回答查询提出的问题,因此更具有针对性,更能适应当前互联网环境下对信息获取的个性化需要,因为它既考虑到了用户的查询条件,又考虑了文档集包含的主要内容。本文的主要工作包括以下几个方面:第一,本文提出了一种以关键词语抽取为核心的文摘句选择策略。通过查询扩展相关技术得到相关多文档集中词语的查询相关性特征,利用最大似然估计得到语料中词语的话题相关性特征,并将这两个特征值进行特征线性融合得到词语的重要度以确定关键词语。然后通过关键词语重要度来给候选句打分,进一步利用改进的MMR(Maximal Marginal Relevance)技术来调整候选句的总得分,最后挑选出文摘句。本文将特征融合引入到词语层面,能够在更细的层面上刻画出句子信息,能够选择出更符合需要的文摘句。第二,本文提出了一种聚类与模板融合的文摘句排序策略。将文摘句集合聚类成子话题集可以保证文摘句的话题不中断,根据文档的文摘代表性选择模板来为文摘句排序可以保证文摘句在逻辑上是连贯的。子话题间采用子话题在模板中的相对位置进行排序,子话题内采用文摘句在模板中的绝对位置进行排序。实验结果显示,本文所提出的方法有效地提高了文摘的可读性。实验结果表明,以关键词抽取为核心的文摘句选择策略和聚类与模板融合的文摘句排序策略都取得了比较好的效果,有效地提高了文摘的质量。(本文来源于《华中师范大学》期刊2009-05-01)
马亮,何婷婷,李芳,陈劲光,邵伟[2](2008)在《以关键词抽取为核心的文摘句选择策略》一文中研究指出针对面向查询的多文档自动文摘,该文提出了一种以关键词抽取为核心的文摘句选择策略。通过查询扩展的相关技术得到相关多文档集中词语的查询相关性特征,利用最大似然估计法得到语料中词语的话题相关性特征,并将这两个特征值进行特征融合得到词语的重要度以确定关键词。然后通过关键词的重要度来给候选句打分,进一步利用改进的MMR(Maximal Marginal Relevance)技术来调整候选句的得分,最后生成文摘。该文将特征融合引入到词语层面,在DUC2005的语料中测试取得了较好的效果。(本文来源于《中文信息学报》期刊2008年06期)
邵伟,何婷婷,胡珀,肖华松[3](2007)在《一种面向查询的多文档文摘句选择策略》一文中研究指出针对面向查询的多文档自动文摘,本文提出了一种多特征融合的文摘句选择策略。首先通过计算句子与查询在语义层面上的相似度,获取句子与查询的关联特征,然后运用构建的语义网络图挖掘句子的全局关联特征, 并综合句子的这两方面特征,对其重要度进行评估。最后利用 MMR 技术,挑选文摘句。实验表明:对主题相对集中的文档集合,该方法以10%的压缩率生成的文摘效果较好;对子主题较多且与查询比较相关的文档集合,以 20%的压缩率生成的文摘效果较好。(本文来源于《内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集》期刊2007-08-01)
文摘句选择论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对面向查询的多文档自动文摘,该文提出了一种以关键词抽取为核心的文摘句选择策略。通过查询扩展的相关技术得到相关多文档集中词语的查询相关性特征,利用最大似然估计法得到语料中词语的话题相关性特征,并将这两个特征值进行特征融合得到词语的重要度以确定关键词。然后通过关键词的重要度来给候选句打分,进一步利用改进的MMR(Maximal Marginal Relevance)技术来调整候选句的得分,最后生成文摘。该文将特征融合引入到词语层面,在DUC2005的语料中测试取得了较好的效果。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
文摘句选择论文参考文献
[1].马亮.面向查询多文档文摘的文摘句选择与排序研究[D].华中师范大学.2009
[2].马亮,何婷婷,李芳,陈劲光,邵伟.以关键词抽取为核心的文摘句选择策略[J].中文信息学报.2008
[3].邵伟,何婷婷,胡珀,肖华松.一种面向查询的多文档文摘句选择策略[C].内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集.2007
标签:面向查询多文档自动文摘; 关键词抽取; 文摘句选择; 聚类;