导读:本文包含了语义库论文开题报告文献综述及选题提纲参考文献,主要关键词:自然语言,语义库,词频-逆文本频率,字向量距离
语义库论文文献综述
杨菊英,江兵,罗佳[1](2019)在《自然语言语义库构建方法研究》一文中研究指出自然语言语义语料库构建是智能云计算环境中实现信息交换的关键步骤,对语义语料库构造技术进行了分析,提出了一种基于词频-逆文本频率(term frequency-inverse document frequency,TF-IDF)和字向量距离的新型网页去重复算法,该方法专注于解决语音识别中的存储问题,为分词和句法分析提供功能支持。该方法可以直接用于语义语料库构建,能提高网页重复数据删除的效率。实验结果表明:该方法能实现云计算平台的语义库构建,且性能优于其他方法,说明了该方法的可行性和有效性。(本文来源于《重庆理工大学学报(自然科学)》期刊2019年10期)
冯宇衡,蒋亦然,赵昀升,潘洋[2](2018)在《具有内部互联特性的语义库模型建立及其在可疑人员识别中的应用》一文中研究指出在已有的可疑人员识别算法已经充分成熟的假设下,为了统筹、调控各种识别算法,并实现有针对性的识别,本文提出了一个具有小世界网络内部互联特性的语义库模型,建立了规则语义库和以其为基础的互连语义库,对可疑识别对象构建了储存临时信息的信息向量。在识别过程中,不断调用能够基于联系强度参数进行特征词排序的计算公式,产生待测序列,从而动态地设定要识别的特征词。通过修改语义库中的参数,使之前的识别经验能作用于新的识别过程。模型的论述依托于机场可疑人员识别这一具体应用情景。(本文来源于《第19届中国系统仿真技术及其应用学术年会论文集(19th CCSSTA 2018)》期刊2018-08-10)
白玛松毛(pemasongmao)[3](2018)在《基于Wordnet的藏文藻饰词语义库构建研究》一文中研究指出藏语的内涵非常丰富,词语的数量呃非常多,其内涵非常丰富,甚至还形成了藏文化,吸引着越来越多的学者去研究和分析它,藏族的词藻学,与算学、戏剧学、诗词学、音韵学等构成了藏族传统文化的主要内容,13世纪之后,藏族文化受到了外来文化的影响,特别是与西藏最接近的印度,他们的文化持续对藏族文化带来着影响,由于印度文化中对词语的使用非常讲究,因此,使得词藻学在藏族文化中获得了更好的发展,所以说藏文藻饰词是藏文化的一种独特现象。从古至今,境内外学者在研究和传承藏族文化的同时竭力运用藏语藻饰词,很多学者也将藻饰词运用到各类学科,进一步丰富和完善了藏语的词汇系统,更进一步加强了藻饰词在藏语文化中的作用性。有学者曾今这样说过辞藻就是用于在描述一段事物的时候,修饰人们的语言,以更好的表达出这件事的真实性或者是虚假性的文化,也有学者指出,每一件事物,除了它本身的表达之外,还有各种各样的形容词可以用来描述它,例如可以用诗歌来进行表达,而这类具有一定审美和修辞的性质的词语,就被成为是藻饰词~([51]),因此,藏族的藻饰词同样也是这个作用,用于做一些特殊的形容和表达,具有特殊的含义和性质。其实,这些认识只是认识了藻饰词的表面,还没有深入探究的其内涵,没有吧藏族文化的精髓给认识到,例如,藏语的“?????????”在翻译为中文的时候,我们应该把它翻译成“藻饰词”,而不能简单的将其直接翻译为“别称”,有学者曾今指出,藏语之所以大量使用了藻饰词,主要是因为藏族文化在长期发展的过程中,力求表达优美,让人们喜欢这样的表达。其次是因为大量使用藻饰词,能够让藏文避免重复和单调,增加藏文的文学美观性,最后还有一点原因是,藏文中大量使用藻饰词,能够有效的调整藏文的音节,使得藏文的整体更加美观可靠。~([52])但截至目前,基于计算机信息处理方面缺乏藻饰词研究。藻饰词分布在藏文学的各种文体和文章,如果不能理解藻饰词,对于文章要达到层面上的理解也是较为困难。关于计算机处理方面的藻饰词研究是藏文信息处理必须要迈入的一步。本文在生语料的选择上依据语料的平衡性,在语料的选择范围中涉及诗歌、佛学、民歌、散文、论文、小说等领域。并从442篇语料中,共提练出1491个藻饰词,在NicroMoft Excel数据库中手工录入其1491个藻饰词,对其进行了英汉翻译,并加注了藻饰词的释义,截止目前词库字数总计10万字。藏文藻饰词传统的分类方法是在词语同属的种类或生存的环境为主要依据而进行分类,并没有从某个特定立场对一个语义类别进行细致地分类,使得原来共同属于一个语义类别的词语,可以在某个或某些语义特征上提取不同的值,从而突出这些词语相互之间的异同。为了弥补这一不足,此文是继扎西草女士的《藏语藻饰词信息库构建》研究的基础上,借鉴北京大学詹韦东所采用的语义分类体系。《藏语藻饰词信息库构建》中对藻饰词的名词、动词、形容词等进行了语义分类,在数词与名词的语义标注中存在部分标注模糊的情况,本文根据藻饰词自身特点和语料库的实际运用性为出发点将藻饰词分为名词和数词两大类(藻饰词无形容词和动词故不做此项分类)并对语义标注进行了调整和补充。本文根据藏文藻饰词的自身特点,结合wordnet本有的语义关系和藏文词汇之间的语义关系,共选取四种适用于藏文藻饰词词汇间的语义,获得了所设置的9个属性字段相应的700个同义词集合,建立了《基于Wordnet的藏文藻饰词的语义库》。能够有效的达到本文所分析的目的,就是基于Wordnet的藏文藻饰词语义关系进行了比较详细的分析。其创新点在于:(1)摒弃了藏文藻饰词传统分类方法的不足,借鉴北京大学詹韦东所采用的语义分类体系结合藏文藻饰词自身特点共分2个大类、57个中层类,层级深度达到8级。(2)根据藏文藻饰词的自身特点,结合wordnet本有的语义关系和藏文词汇之间的语义关系,共选取四种适用于藏文藻饰词词汇间的语义,获得了所设置的9个属性字段相应的700个同义词集合。本文以Wordnet设计原理及方法为理论依据,根据真实语料获得藏文藻饰词并分析,以满足分析结果的科学性和系统性。进一步为面向藏文信息处理的现代藏语语义信息词典做好了基础性理论研究和准备。(本文来源于《西北民族大学》期刊2018-05-01)
于金山,吴皓,田国会,薛英花,赵贵祥[4](2016)在《基于云的语义库设计及机器人语义地图构建》一文中研究指出针对室内移动机器人在智能服务任务中难以获得复杂环境语义的问题,通过设计云端语义库,实现基于语义获取框架的机器人语义地图构建,使机器人不仅掌握面向导航的环境几何描述,而且获得了复杂环境下基于丰富语义库的含物品关联归属关系的语义地图,解决了语义地图构建过程中语义信息添加可靠性低、地图更新存在误差及扩展性不足等问题.首先给出了一种语义库构建方案,基于支持向量机实现语义库分类形成子语义库,在子语义库基础上基于网络文本分类来提取关键特征点形成特征模型库,通过语义分类列表整合子语义库实现物品查询.其次,论述了面向智能服务任务的云端语义地图实现,基于多尺度图像分割与视差图分析,设计标注库与归属库描述物品关联归属关系.最后进行了有关语义地图构建及语义库分类效率的仿真实验与结果分析,验证了方法的有效性.(本文来源于《机器人》期刊2016年04期)
李沛杰,张兴明,沈剑良[5](2015)在《基于动态信任语义库的Web服务匹配算法》一文中研究指出针对传统基于语义的Web服务匹配算法无法解决模糊语义下匹配的问题,提出一种基于动态信任语义库的Web服务匹配算法。将交互实体对服务提供者的评价行为进行灰色聚合,筛选出可信实体;依据可信实体对服务提供者的服务描述,提取语义信息,构建动态的语义库,对于Web服务描述中的模糊语义概念,从可信实体的服务描述中抽取相应概念并替换;计算服务请求向量与服务描述向量的语义相似度,衡量Web服务的匹配程度。实验结果表明,在存有模糊语义的情况下,该算法具有更好的匹配效果。(本文来源于《计算机工程与设计》期刊2015年03期)
王斌,冯嘉礼[6](2013)在《基于属性坐标系框架下的Freebase语义库研究》一文中研究指出属性坐标系是由n个不相关的属性组成的一个n-1维坐标系。第n+1个属性,可以由这n个属性做合取运算得到;这样在这个n-1维坐标系中,就形成一个唯一点来表示这第n+1个属性。2007年Freebase数据库的建立,使得该属性坐标系理论得以验证,并为属性坐标系的建立提供可能,而且将在语义相关度计算中发挥重要作用。(本文来源于《微型机与应用》期刊2013年21期)
徐南轩,邹恒明[7](2008)在《一种反映词语相关度语义库的构建方法》一文中研究指出为了反映词语间的语义相关程度,提出了一种基于向量空间模型的构建语义库的新方法.在构建语义库时,对大量语料文本进行迭代式学习,在学习过程中引入淘汰算法,并综合考虑了诸如共同出现次数、平均出现距离、信息熵以及单字语义信息等多种对词语间语义关系产生影响的因素.实验证明,用该方法得到的相关语义库能够较好地反映现实世界中词语之间的相关程度.(本文来源于《上海交通大学学报》期刊2008年07期)
国德峰[8](2008)在《基于数字电视节目的相关语义库的实现与应用》一文中研究指出在人们对语言的感官认知中,判断词语间的语义相关程度一直扮演着一个重要的角色,同时,这种语义相关关系在很多领域中都有实际的应用,例如信息检索,文本分类,机器翻译等等。构造相关语义库通常有基于知网和语料训练两种方法。知网采用人工方法,主观性太强,且不能动态更新;通常的语料训练对时空复杂度的要求都比较高,受语料稀疏和语料噪声的影响也比较大,不宜直接应用于嵌入式环境。为了解决以上问题,本文提出了一种以向量空间模型为基础的相关语义库的构造方法。本文将所要介绍的相关语义库称为Corpus库。本文首先提出了Corpus的逻辑模型,Corpus库综合考虑了多种与词语间语义关系有关的因素,创新性地将词语之间的共同出现次数、平均距离、窗口大小、信息熵、单字匹配等概念引入模型。接下来,我们给出了训练词语相关度的裁剪公式,在构建相关语义库过程中,依此公式对大量语料进行了多次迭代式学习以尽量控制空间大小。其中,我们对模型中相关词空间各个因素进行统计,针对每一个词语,根据与其相关的词语的统计信息,为这些相关词语分配权值,最后按照权值大小进行排序,排位靠前的相关词语会被最终留下存入主词语的相关空间。本文针对Corpus自身模型和Corpus应用做了两个实验。实验一证明了用这样的构建方法得到的相关语义库能够较好的反映现实世界中词语之间的相关程度。实验二提出了一种基于Corpus库的模糊信息匹配模型,它基于一个四维的向量空间,在模糊匹配的过程中该模型会用扩展后的检索信息与待查全部文本资源进行匹配,并得出最终的检索结果,该实验证明结合相关语义库的模糊匹配能够检索出更丰富的与检索需求相符的信息。(本文来源于《上海交通大学》期刊2008-01-01)
尚宗敏,王海洋[9](2006)在《智能流程应用模式下基于流程语义库的需求获取》一文中研究指出为自动生成满足用户需求的个性化流程,在给出智能流程应用模式的基础上,提出一种用户个性化需求获取新方法。对业务流程中活动进行归纳和抽象,定义一种新服务——元服务,并由元服务组成流程语义库,然后基于流程语义库,提出一种用户需求获取算法,帮助用户快速准确地输入需求信息。理论分析和应用表明:算法提高了用户需求获取的准确程度和效率。(本文来源于《通信学报》期刊2006年11期)
尚宗敏,崔立真,王海洋[10](2006)在《智能流程应用模式下基于流程语义库的流程自动生成方法》一文中研究指出1前言面对快速变化的市场需求,基于Internet的企业经营活动必须以动态和灵活的策略作为立足之计,同时流程的应用模式也由面向企业用户逐渐转向面向普通用户。这就要求业务经营活动不仅要基(本文来源于《第二十叁届中国数据库学术会议论文集(技术报告篇)》期刊2006-11-10)
语义库论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在已有的可疑人员识别算法已经充分成熟的假设下,为了统筹、调控各种识别算法,并实现有针对性的识别,本文提出了一个具有小世界网络内部互联特性的语义库模型,建立了规则语义库和以其为基础的互连语义库,对可疑识别对象构建了储存临时信息的信息向量。在识别过程中,不断调用能够基于联系强度参数进行特征词排序的计算公式,产生待测序列,从而动态地设定要识别的特征词。通过修改语义库中的参数,使之前的识别经验能作用于新的识别过程。模型的论述依托于机场可疑人员识别这一具体应用情景。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语义库论文参考文献
[1].杨菊英,江兵,罗佳.自然语言语义库构建方法研究[J].重庆理工大学学报(自然科学).2019
[2].冯宇衡,蒋亦然,赵昀升,潘洋.具有内部互联特性的语义库模型建立及其在可疑人员识别中的应用[C].第19届中国系统仿真技术及其应用学术年会论文集(19thCCSSTA2018).2018
[3].白玛松毛(pemasongmao).基于Wordnet的藏文藻饰词语义库构建研究[D].西北民族大学.2018
[4].于金山,吴皓,田国会,薛英花,赵贵祥.基于云的语义库设计及机器人语义地图构建[J].机器人.2016
[5].李沛杰,张兴明,沈剑良.基于动态信任语义库的Web服务匹配算法[J].计算机工程与设计.2015
[6].王斌,冯嘉礼.基于属性坐标系框架下的Freebase语义库研究[J].微型机与应用.2013
[7].徐南轩,邹恒明.一种反映词语相关度语义库的构建方法[J].上海交通大学学报.2008
[8].国德峰.基于数字电视节目的相关语义库的实现与应用[D].上海交通大学.2008
[9].尚宗敏,王海洋.智能流程应用模式下基于流程语义库的需求获取[J].通信学报.2006
[10].尚宗敏,崔立真,王海洋.智能流程应用模式下基于流程语义库的流程自动生成方法[C].第二十叁届中国数据库学术会议论文集(技术报告篇).2006