同义词信息论文-肖淋峰

同义词信息论文-肖淋峰

导读:本文包含了同义词信息论文开题报告文献综述及选题提纲参考文献,主要关键词:同义词挖掘,语义相似度,概念检索,智能检索

同义词信息论文文献综述

肖淋峰[1](2018)在《面向检索信息的同义词挖掘》一文中研究指出随着计算机技术的飞速发展,搜索引擎的应用深入到各行各业,使用搜索引擎对信息进行检索已经深入到人民群众的日常生活当中,信息的查找与获取变得越来越频繁的同时,信息的精准查找与获取也越来越有挑战性。如何从浩如烟海的信息资源库中,更加准确的理解用户想要搜索的关键词,使得关键词搜索内容能够得到拓展和更加准确的推荐,是信息检索领域一直以来的重要研究课题。传统的信息检索服务已渐渐不能满足用户的检索需求,智能的、基于概念的信息检索系统成为未来的发展方向。识别用户搜索关键词的可替代同义词是实现智能信息检索的重要方法之一,而要实现高效的同义词拓展,就需要一个强大的同义词表。本文中定义的同义词,是在相似的上下文语境中可以相互替代的词。随着时代的变化,语言的应用日新月异,使用传统的同义词词典查询的方法对同义词进行判别或者发现已完全不适用。使用更加智能的方法进行同义词挖掘,找到新的同义词表势在必行。近年来,随着自然语言处理技术的进步,关于同义词的研究越来越多,需要用到同义词的领域涉及方方面面,研究者们提出了众多先进的配对同义词辨析和基于语料库的同义词集提取方法。本文面向检索信息进行同义词挖掘,与使用基于特定业务的检索数据有一定的规则找出候选词对不同,本文通过设计对齐规则和短语对抽取规则,找到无特定业务query数据的同义词挖掘方法;将Distributed Representation词向量应用于特征工程;通过训练机器学习模型,使用模型对同义词对做出判定,最终在浩瀚如海的信息中挖掘出同义词,提取同义词表。本文使用这类数据来挖掘同义词表,在相当程度上克服了传统同义词表过时、无法找到新词和未登录词等弊端;结合统计特征以及Negative Sampling的Skip-gram共现矩阵模型训练的词向量特征进行模型训练。同义词的自动发现和识别,在基于概念的信息检索领域有着十分重大的研究意义和实际应用价值,本文在国内和国外短文本相似度算法、同义词识别算法进行研究和分析的基础上,对面向检索信息的同义词挖掘方法进行了深入研究。(本文来源于《电子科技大学》期刊2018-03-01)

李国臣,吕雷,王瑞波,李济洪,李茹[2](2016)在《基于同义词词林信息特征的语义角色自动标注》一文中研究指出该文使用同义词词林语义资源库,以词林中编码信息为基础构建新的特征,使用条件随机场模型,研究了汉语框架语义角色的自动标注。该文在先前的基于词、词性、位置、目标词特征的基础上,在模型中加入不同的词林信息特征,以山西大学的汉语框架语义知识库为实验语料,研究了各词林信息特征分别对语义角色边界识别与分类的影响。实验结果表明,词林信息特征可以显着提高语义角色标注的性能,并且主要作用在语义角色分类上。(本文来源于《中文信息学报》期刊2016年01期)

付敏,戴祖旭[3](2015)在《基于多目标规划的同义词替换信息隐藏模型》一文中研究指出从含密载体这一个物理信道抽象出秘密信息和原始载体分别到含密载体的两个逻辑信道,前者关联信息隐藏容量,后者作为载体统计保真约束的系统接口,通过建立多目标规划模型来求解信息隐藏函数,使得信息隐藏函数的设计可受原始载体、秘密信息的分布以及系统统计失真指标控制.MATLAB数值实验结果说明该算(?)可以有效的寻找到最优的信息隐藏函数.(本文来源于《数学的实践与认识》期刊2015年15期)

柳祚鹏[4](2015)在《支持同义词搜索和抗信息泄漏的对称可搜索加密技术研究》一文中研究指出在大数据时代,越来越多的用户开始使用廉价和计算能力强大的云外包服务。然而,安全因素成为了它进一步发展的主要障碍,导致出现这种不安全问题的原因在于:云外包商并非完全可信。一个简单的解决方案是在数据外包之前对数据加密。但是,数据的加密限制了用户的有效检索。因此,如何避免云端数据被未经授权的人访问并维持对加密数据的有效计算已成为云计算外包领域的研究重点。基于安全索引的可搜索加密技术解决了该难题。可搜索加密技术包括对称可搜索加密技术、公钥可搜索加密技术和隐私信息检索,它们分别解决了不同场景下的应用难题。本文仅仅关注云计算环境下的对称可搜索加密技术,主要研究了同义词搜索和抗信息泄露的对称可搜索加密技术。为了解决现有方案中信息泄漏的问题,我们提出了一个抗信息泄漏的可搜索加密方案。在方案中,我们首先对访问模式和信息泄漏提出了新的定义。与已有的可搜索加密方案相比,我们的方案避免了大小模式的泄漏,同时仅以概率泄漏访问模式和搜索模式。另外,该方案没有增加客户端的计算与存储开销以及双方之间交互的通讯开销,达到了Non-adaptive安全。但是,方案提高了服务器的存储和计算开销。到目前为止,尚未有方案对复杂条件搜索中的同义词搜索问题进行研究。在用户记忆有限与人员频繁流动的现实场景下,现有的方案不足以处理这些细节。本文对这个问题进行了研究,首次提出了同义词搜索问题,并设计了一个支持同义词搜索的对称可搜索加密方案。该方案具有如下优势:为了提高方案的可扩展性,方案中引入了同义词函数和同义词集合;通过严格的安全分析,我们验证该方案是正确的并且达到了Non-adaptive安全。此外,我们提出的算法是高效的,没有增加用户的计算和存储开销,传输开销仍为O(1),查找时间复杂度仅为O(p)(p表示单词同义词集合的大小)。通过返回单词同义词集的文档集合,该技术弥补了支持模糊搜索方案的不足,提高了相似搜索系统的可适用性。(本文来源于《上海交通大学》期刊2015-05-25)

冷本扎西[5](2015)在《面向信息处理的藏语名词同义词知识库构建研究》一文中研究指出藏文自然语言处理始终都无法离开现实语言的支撑,让计算机懂得并理解藏语也离不开不同颗粒度层面上构建的知识库、规则库和藏语语义信息库等的支持。因此,我们从建立不同层级语言单位都适用的藏语信息库的理念出发,借鉴目前汉语信息处理研究的权威理论及其成果,从层级语言单位最底层的词和为数不多的最基本的短语开始,描述现代藏文词语的字符信息、音节数量、词性分类和标注、构词结构、单合、搭配信息和语义表示等信息来建立《藏语名词同义词知识库》。要使计算机理解自然语言,“必须要从语义学的角度要解决叁个平面上的问题,其中第一个要解决的就是词汇意义”。词汇意义是驾驭整个语义系统的基础,因此研制一部面向信息处理的现代藏语语义词典不仅是一项具有奠基性的知识工程,而且也是一项相当重要的基础理论类研究。本文于第一章中引入绪论,主要探讨了同义词的国内外研究现状同时概述藏文信息处理的发展历程。分别于第二章与第叁章中讨论了实词、名词以及名词同义词的含义界定、分类等问题。第四章为本文的重点,主要对知识库中字段设立的相关问题进行研究,分别对名词的分类与兼类问题、藏语名词同义词的词汇来源、构词方法统计、词长与字符数统计、词频与搭配统计、同义词的语义知识研究、义项的排列权重以及同义词词表的测试语料等共8项专题进行说明。知识库构建的主要落脚点理应在于其应用上,本文在第五章中对面向藏文搜索引擎的名词同义词知识库构建进行应用研究。文章最后一章节为结尾部分,主要讨论研究工作中的难点与对未来工作的展望。(本文来源于《西北民族大学》期刊2015-05-01)

马海昌,张志昌,赵学锋,孙飞[6](2014)在《结合潜在语义分析与点互信息的同义词抽取》一文中研究指出同义词在信息检索、自动文摘、情感分析、机器翻译等应用中都发挥着重要的作用。该文提出在大规模语料中结合潜在语义分析与上下文互信息进行同义词挖掘的方法,分析了不同的词汇上下文窗口选择、权值计算、潜在语义分析降维、余弦相似度计算在同义词抽取中的作用。实验结果表明,同义词抽取的效果明显提高。(本文来源于《电脑知识与技术》期刊2014年01期)

戴祖旭,常健,陈静[7](2009)在《抵抗同义词替换攻击的文本信息隐藏算法》一文中研究指出为利用自然语言的词性标记实现文本信息隐藏,研究了词性标记串的序关系及其变换性质。在词性标记集上定义适当的偏序关系,通过计算标记串逆序数的奇偶性,可将标记串映射为0或1。研究了随机标记串序列对应的二进制序列的自相关性和互相关性,结果表明,归一化自相关和互相关系数稳定在0.55左右,具有较强的区分不同参考模板的能力。证明了逆序数奇偶性在标记串符号对换、增加和删除操作下的变换性质。提出了利用词性标记串逆序数奇偶性隐藏信息的算法。该算法能抵抗同义词替换攻击。(本文来源于《四川大学学报(工程科学版)》期刊2009年04期)

匡倩[8](2009)在《高级英汉双解学习词典的同义词信息处理》一文中研究指出词汇同义关系是语义词汇关系的重要组成部分,也是影响语言词汇的语言现象的一个因素。作为英语教学的必要工具,英语学习词典应当尽可能有效地提供同义词信息,帮助学习者准确把握同义词间的细微差别,熟练准确地使用语言。本文通过比较四本颇具影响力的高级英汉双解学习词典中的同义词信息处理,总结了英语学习词典在处理同义词信息方面主要采取参见、插图、同义词辨析专栏和图表等几种模式,发现现行的高级英汉双解学习词典的同义词信息处还存在着不足,有些同义词信息处理方式不利用学习者习得同义词。为了解决以上问题,本文首先从使用者角度出发,基于语义理论和二语词汇习得的相关理论,利用中国学习者语料库和英国国家语料库,对比相同的同义词在语料中的具体表现形式,发现中国高级英语学习者对同义词的句法、搭配等特征了解不够深入,对某些词使用过多或过少的情况出现等一系列问题。主要是对同义词的特征把握不当,母语导致的负迁移,学习者倾向早期习得的词汇以及二语的“早期对应”等因素所致。此外,这些问题还反映出高级学习者的词汇发展尚未完善,一语词汇在习得中发挥主要作用。鉴于此,本论文在理论高度上提出解决这些问题的方法,即增加同义词相关信息的输入;提供恰当的语境;采用同义词辨析;充分发挥二语对应词的作用,对不同类别的同义词组应采取不同的处理方式。最后,根据中国高级英语学习者同义词词汇的习得特征,并结合所提出的同义词的习得策略,借鉴英语学习词典处理同义词信息的一些好的方法,提出英语学习词典中优化处理同义词信息的一系列原则,并根据这些原则提出处理同义词信息的新模式和词条样本。(本文来源于《西南大学》期刊2009-04-15)

刘政,朱杰,吴树芳,曹振[9](2009)在《信息检索中的同义词》一文中研究指出同义词在信息检索中的作用日趋重要,它可在一定程度上实现语义检索,提高检索性能。一般情况下,一个术语的同义词的个数是多于一个的,为了加以区别,目前普遍采用相似度计算来度量术语和其同义词的相似程度。在介绍信息检索同义词的基础上,给出了常用的词语相似度计算方法。(本文来源于《电脑知识与技术》期刊2009年09期)

郑艳森[10](2009)在《基于同义词库的语义相似度计算及其XML信息集成方法研究》一文中研究指出提出一种基于同义词库的多XML信息源语义相似度计算及集成的方法,可以实现对没有DTD和XML Schema的语义异构XML信息源进行语义集成。(本文来源于《福建轻纺》期刊2009年01期)

同义词信息论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

该文使用同义词词林语义资源库,以词林中编码信息为基础构建新的特征,使用条件随机场模型,研究了汉语框架语义角色的自动标注。该文在先前的基于词、词性、位置、目标词特征的基础上,在模型中加入不同的词林信息特征,以山西大学的汉语框架语义知识库为实验语料,研究了各词林信息特征分别对语义角色边界识别与分类的影响。实验结果表明,词林信息特征可以显着提高语义角色标注的性能,并且主要作用在语义角色分类上。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

同义词信息论文参考文献

[1].肖淋峰.面向检索信息的同义词挖掘[D].电子科技大学.2018

[2].李国臣,吕雷,王瑞波,李济洪,李茹.基于同义词词林信息特征的语义角色自动标注[J].中文信息学报.2016

[3].付敏,戴祖旭.基于多目标规划的同义词替换信息隐藏模型[J].数学的实践与认识.2015

[4].柳祚鹏.支持同义词搜索和抗信息泄漏的对称可搜索加密技术研究[D].上海交通大学.2015

[5].冷本扎西.面向信息处理的藏语名词同义词知识库构建研究[D].西北民族大学.2015

[6].马海昌,张志昌,赵学锋,孙飞.结合潜在语义分析与点互信息的同义词抽取[J].电脑知识与技术.2014

[7].戴祖旭,常健,陈静.抵抗同义词替换攻击的文本信息隐藏算法[J].四川大学学报(工程科学版).2009

[8].匡倩.高级英汉双解学习词典的同义词信息处理[D].西南大学.2009

[9].刘政,朱杰,吴树芳,曹振.信息检索中的同义词[J].电脑知识与技术.2009

[10].郑艳森.基于同义词库的语义相似度计算及其XML信息集成方法研究[J].福建轻纺.2009

标签:;  ;  ;  ;  

同义词信息论文-肖淋峰
下载Doc文档

猜你喜欢